Форум программистов, компьютерный форум, киберфорум
PHP
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.75/4: Рейтинг темы: голосов - 4, средняя оценка - 4.75
 Аватар для zontik24
36 / 33 / 10
Регистрация: 14.06.2013
Сообщений: 432

Начинка DomDocument и алгоритмы парсинга файлов

23.09.2017, 01:58. Показов 878. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте, есть класс http://php.net/manual/ru/class.domdocument.php

1) Где можно почитать, как реализованы алгоритмы парсинга html в данном классе? Вопрос не совсем тривиальный, конечно. Англоязычный интернет ковыряю, пока нет результатов. Может, кто чем поможет, в какую сторону копать

2) Да, и вообще, какие можно выделить алгоритмы парсинга файлов word, html, xml? Везде одни готовые библиотеки, а внутри то что? Просто какая-то самописка? Есть какие-то устоявшиеся алгоритмы парсинга?
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
23.09.2017, 01:58
Ответы с готовыми решениями:

Математические алгоритмы для парсинга текста из word и xml
Здравствуйте, какие есть математические алгоритмы для парсинга текста из word или xml или похожих. Проискал и русский и английский интернет...

Математические алгоритмы для парсинга текста из word и xml или подобных
Здравствуйте, какие есть математические алгоритмы для парсинга текста из word или xml или похожих. Проискал и русский и английский интернет...

Реализация парсинга XML файлов
Здравствуйте! Мне нужно с XML фала вытащить ссылку с тега <DownloadURL></DownloadURL> . Вот пример кода <UpdateData...

1
Эксперт PHP
4925 / 3920 / 1620
Регистрация: 24.04.2014
Сообщений: 11,441
23.09.2017, 06:36
Цитата Сообщение от zontik24 Посмотреть сообщение
Где можно почитать, как реализованы алгоритмы парсинга html в данном классе?
В исходниках. Тут код php https://github.com/php/php-src, расширение в ext/dom
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
23.09.2017, 06:36
Помогаю со студенческими работами здесь

Noile Bechmark 1.2 (бенчмарк парсинга файлов) - тестируем!
Добрый день! Бенчмарк измеряет скорость парсинга текстовых файлов в однопоточном и многопоточном режимах. Изменения в версии 1.2:...

Есть ли в .NET средства для парсинга YAML файлов
Интересует есть ли у NET средства для парсинга YAML файлов? Искал, но нашел только китайскую наработку какую то и все.

Итерация строк двух файлов для парсинга Юла
Дано два файла: первый - со ссылками на категории сайта Юла. Имеет вид: https://youla.ru/moskva/zhenskaya-odezhda/aksessuary ...

Испортилась кодировка файлов после парсинга с помощью Html Agility Pack
В общем мне нужно было прочитать и отредактировать примерно 4 тысячи файлов, в некоторых были слова наподобие bal paré и символы §...

Начинка для 3D принтера
Воспользовался поиском, вроде бы желаемого не нашёл. Опыта в этом мире мало, но плох тот стажёр, которого не хочется убить за кол-во...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Оттенки серого
Argus19 18.03.2026
Оттенки серого Нашёл в интернете 3 прекрасных модуля: Модуль класса открытия диалога открытия/ сохранения файла на Win32 API; Модуль класса быстрого перекодирования цветного изображения в оттенки. . .
SDL3 для Desktop (MinGW): Рисуем цветные прямоугольники с помощью рисовальщика SDL3 на Си и C++
8Observer8 17.03.2026
Содержание блога Финальные проекты на Си и на C++: finish-rectangles-sdl3-c. zip finish-rectangles-sdl3-cpp. zip
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие. Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора ВВЕДЕНИЕ Выполняя задание на управление насосной группой заполнения резервуара,. . .
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru