Форум программистов, компьютерный форум, киберфорум
PHP для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.76/34: Рейтинг темы: голосов - 34, средняя оценка - 4.76
23 / 23 / 11
Регистрация: 04.12.2012
Сообщений: 579

Парсинг книги с расширением fb2

23.03.2015, 21:58. Показов 6779. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте. Есть книга с расширением .fb2. Я из неё вытаскиваю содержание (возможно, немного кривым способом, но вроде работает). И использую paginator для раздробления текста на страницы. Код следующий:

PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
//Читаем файл.
$filename = 'MyBook.fb2';
//Создаем XML документ
$doc = new DOMDocument();
//Отключаем проверку ошибок
$doc->strictErrorChecking = false;
$doc->recover = true;
//Загружаем содержимое файла
$load = $doc->load($filename, LIBXML_NOERROR);
$section = $doc->getElementsByTagName('section');
$section = $section->item(0);
 
$stringXML = $doc->saveXML($section);
$limit = 3000;
$paginator = getPaginatorForBooks('index2.php', $stringXML, $limit);
 
echo substr($stringXML, $start, $limit);
echo $paginator;
Функция getPaginatorForBooks
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
function getPaginatorForBooks($targetpage, $book_xml, $limit)
{
    $symbol = '?';
    $total_pages = strlen($book_xml) / $limit;
    
    $stages = 3;
    $page = $_GET['page'];
    
    global $start;
    if($page){
        $start = ($page - 1) * $limit; 
    }else{
        $start = 0; 
    }
    
    // Инициализируем начальные параметры
    if ($page == 0) $page = 1;
    $prev = $page - 1;  
    $next = $page + 1;                          
    $lastpage = ceil($total_pages);     
    $LastPagem1 = $lastpage - 1; // Предпоследняя страница             
        
    $paginate = ''; // div блок, в котором будет содержаться навигация
    
    if($lastpage > 1)
    {   
        $paginate .= "<div class='paginate'>";
        // Формирование ссылки "Предыдущая"
        if ($page > 1){
            $paginate.= "<a href='$targetpage" . $symbol . "page=$prev'>Предыдущая</a>";
        }else{
            $paginate.= "<span class='disabled'>Предыдущая</span>";   }
 
        // Страницы 
        if ($lastpage < 7 + ($stages * 2))  // Недостаточно страниц для создания троеточия
        {   
            for ($counter = 1; $counter <= $lastpage; $counter++)
            {
                if ($counter == $page){
                    $paginate.= "<span class='current'>$counter</span>";
                }else{
                    $paginate.= "<a href='$targetpage" . $symbol . "page=$counter'>$counter</a>";}                  
            }
        }
        elseif($lastpage > 5 + ($stages * 2))   // Достаточно страниц, чтобы скрыть несколько из них
        {
            if($page < 1 + ($stages * 2))       
            {
                for ($counter = 1; $counter < 4 + ($stages * 2); $counter++)
                {
                    if ($counter == $page){
                        $paginate.= "<span class='current'>$counter</span>";
                    }else{
                        $paginate.= "<a href='$targetpage" . $symbol . "page=$counter'>$counter</a>";}                  
                }
                $paginate.= "...";
                $paginate.= "<a href='$targetpage" . $symbol . "page=$LastPagem1'>$LastPagem1</a>";
                $paginate.= "<a href='$targetpage" . $symbol . "page=$lastpage'>$lastpage</a>";     
            }
            elseif($lastpage - ($stages * 2) > $page && $page > ($stages * 2))
            {
                $paginate.= "<a href='$targetpage" . $symbol . "page=1'>1</a>";
                $paginate.= "<a href='$targetpage" . $symbol . "page=2'>2</a>";
                $paginate.= "...";
                for ($counter = $page - $stages; $counter <= $page + $stages; $counter++)
                {
                    if ($counter == $page){
                        $paginate.= "<span class='current'>$counter</span>";
                    }else{
                        $paginate.= "<a href='$targetpage" . $symbol . "page=$counter'>$counter</a>";}                  
                }
                $paginate.= "...";
                $paginate.= "<a href='$targetpage" . $symbol . "page=$LastPagem1'>$LastPagem1</a>";
                $paginate.= "<a href='$targetpage" . $symbol . "page=$lastpage'>$lastpage</a>";     
            }
            else
            {
                $paginate.= "<a href='$targetpage" . $symbol . "page=1'>1</a>";
                $paginate.= "<a href='$targetpage" . $symbol . "page=2'>2</a>";
                $paginate.= "...";
                for ($counter = $lastpage - (2 + ($stages * 2)); $counter <= $lastpage; $counter++)
                {
                    if ($counter == $page){
                        $paginate.= "<span class='current'>$counter</span>";
                    }else{
                        $paginate.= "<a href='$targetpage" . $symbol . "page=$counter'>$counter</a>";}          
                }
            }
        }
                    
        // Формирование ссылки "Следующая"
        if ($page < $counter - 1){ 
            $paginate.= "<a href='$targetpage" . $symbol . "page=$next'>Следующая</a>";
        }else{
            $paginate.= "<span class='disabled'>Следующая</span>";
        }
            
        $paginate.= "</div>";
    }
    return $paginate;
}
Получается примерно результат, показанный на рисунке 1.

Подскажите, как можно модернизировать код, чтобы:
Во-первых, обрезалось не на символах, а на словах, или лучше - на абзацах. Тогда, насколько я понял, переменная $limit будет постоянно меняться, но пока не могу сообразить, как это сделать.
Во-вторых, не могу понять, почему появляется символ в самом начала...
В-третьих, если присмотреться к самой верхней части, то первый абзац не является абзацем (он обрезается и не входит внутрь тега <p>). Но, вроде бы, если решить первый вопрос, то третий сам решится))
Миниатюры
Парсинг книги с расширением fb2  
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
23.03.2015, 21:58
Ответы с готовыми решениями:

Вывод книги (fb2) с постраничной навигацией
Здравствуйте. Есть книга с расширением .fb2. Я из неё вытаскиваю содержание (возможно, немного кривым способом, но вроде работает). И...

Парсинг fb2
Получаю данные о книге таким образом //Создаем XML документ $doc = new DOMDocument(); //Отключаем проверку ошибок ...

Как сделать парсинг fb2 книги?
Срочно нужно узнать как можно парсить fb2 формат. Знаю что можно с помощью Linq, но как? Напишите хотя кусок кода ) Добавлено...

3
 Аватар для alpex
603 / 578 / 103
Регистрация: 16.07.2012
Сообщений: 1,762
24.03.2015, 01:37
перед выводом ищите последнюю точку и запоминаете лимит в куках например
strrchr
mb-strrchr
0
23 / 23 / 11
Регистрация: 04.12.2012
Сообщений: 579
24.03.2015, 10:40  [ТС]
alpex, а вот если запоминать лимит и передавать его в функцию getPaginatorForBooks($targetpage, $book_xml, $limit) третьим параметром, то общее количество страниц может постоянно меняться, это ж неправильно?
0
 Аватар для alpex
603 / 578 / 103
Регистрация: 16.07.2012
Сообщений: 1,762
24.03.2015, 17:56
Dmitrin, в принципе да, на одну страницу может измениться
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
24.03.2015, 17:56
Помогаю со студенческими работами здесь

Как правильно парсить книги fb2?
Всем привет. Не подскажите. Как правильно парсить книги в формате fb2? Пробую через linq, но почему-то только половину отображают. ...

Как создать конвертер (fb2->txt,txt->fb2)
Здраствуйте. Кто знает где можна достать исходник конвертера(fb2-&gt;txt,txt-&gt;fb2), ну и по возможности других текстовых форматов. И ищё: где...

Иконка файла (книги) с расширением .xls (Табличный редактор Microsoft Excel)
Можно ли изменить иконку файла (книги) Excel (файла с расширением.xls). Чтобы иконка поменялась не у всех файлов Excel на моём компьютере,...

Сравнить ФИО из книги 1 и книги 2, и если совпадают, то в столбец А книги 1, подставить данные из столбца В книги 2
Добрый день! Подскажите, как сделать-есть 2 книги. Нужно сравнить фамилии из книги 1 и книги 2 и если ФИО совпадает, то в столбец А книги...

Парсинг страниц: нужны статьи, книги и другая информация
Всем привет, интересуют все возможные статью на эту тему, заранее благодарен.............


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Ниже машинный перевод статьи The Thinkpad X220 Tablet is the best budget school laptop period . Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы,. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru