|
5 / 6 / 3
Регистрация: 02.02.2014
Сообщений: 171
|
|
Парсинг html11.09.2021, 15:07. Показов 1118. Ответов 2
Метки парсинг html (Все метки)
Доброго времени всем!
Я хотел спарсить html файл с помощью Xpath. У меня получилось спарсить только текст. Как можно спарсить текст, чтобы был виден не только текст, но и теги html? Или может есть метод в котором можно узнать все теги документа? Просто в самом html файле много стилей и скриптов, что сложно выстроить иерархию документа.
0
|
|
| 11.09.2021, 15:07 | |
|
Ответы с готовыми решениями:
2
Парсинг HTML html парсинг Парсинг страницы html |
|
168 / 124 / 42
Регистрация: 25.10.2019
Сообщений: 476
|
|||||||||||
| 13.05.2022, 22:26 | |||||||||||
|
код
0
|
|||||||||||
|
34 / 11 / 6
Регистрация: 09.01.2018
Сообщений: 189
|
|
| 15.05.2022, 13:57 | |
|
Если HTML валидный XML (то есть является XHTML) то помогут библиотеки для работы с DOM XML. Например DOMDocument или SimpleXML, которые есть по-умолчанию в PHP если подключено расширение libxml
https://www.php.net/manual/ru/refs.xml.php
0
|
|
| 15.05.2022, 13:57 | |
|
Помогаю со студенческими работами здесь
3
Парсинг HTML таблиц Парсинг Html страницы Парсинг HTML-таблицы Парсинг html-кода Парсинг html страницы Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Символьное дифференцирование
igorrr37 13.02.2026
/ *
Логарифм записывается как: (x-2)log(x^2+2) - означает логарифм (x^2+2) по основанию (x-2).
Унарный минус обозначается как !
*/
#include <iostream>
#include <stack>
#include <cctype>. . .
|
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
|
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу,
и светлой Луне.
В мире
покоя нет
и люди
не могут жить в тишине.
А жить им немного лет.
|
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила»
«Время-Деньги»
«Деньги -Пуля»
|
|
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога
Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога
Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
|
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
|