|
0 / 0 / 0
Регистрация: 23.03.2013
Сообщений: 20
|
||||||||||||||||
Выбор дочерних HTML элементов через HtmlAgilityPack23.03.2013, 17:57. Показов 2622. Ответов 6
Метки нет (Все метки)
Добрый день. Я новичок в C#, поэтому не могу разобраться с таким моментом. В Python существует библиотека BeautifulSoup для парсинга html-страниц. Там есть такая функция. Можно ли что-то подобное сделать при помощи HtmlAgilityPack. Я пробовал через
0
|
||||||||||||||||
| 23.03.2013, 17:57 | |
|
Ответы с готовыми решениями:
6
Какие-то странности с html, из-за этого трудности с парсингом в HtmlAgilityPack.dll Парсинг HTML и htmlagilitypack Спарсить курс валюты из Html с HtmlAgilityPack |
|
169 / 132 / 29
Регистрация: 16.02.2013
Сообщений: 867
|
|
| 23.03.2013, 21:27 | |
|
а с помощью регулярок не лучше?
0
|
|
|
352 / 331 / 49
Регистрация: 12.12.2011
Сообщений: 563
|
|||||||||||
| 23.03.2013, 21:54 | |||||||||||
|
Не совсем понял вопроса, или даже совсем не понял но вот что получилось
Выведет содержимое всех параграфов на странице, без тегов
0
|
|||||||||||
|
0 / 0 / 0
Регистрация: 23.03.2013
Сообщений: 20
|
||||||||||||
| 24.03.2013, 19:18 [ТС] | ||||||||||||
0
|
||||||||||||
|
352 / 331 / 49
Регистрация: 12.12.2011
Сообщений: 563
|
||||||||||||||||||||||||||||||||||||
| 24.03.2013, 21:00 | ||||||||||||||||||||||||||||||||||||
|
heliogracie, потому что HTML разметка имеет древовидную структуру
Например мы имеем документ вот такой структуры
след. итерация
0
|
||||||||||||||||||||||||||||||||||||
|
0 / 0 / 0
Регистрация: 23.03.2013
Сообщений: 20
|
|
| 25.03.2013, 10:51 [ТС] | |
|
Yukikaze, неужели нет никакого способа извлечь html-код без повторов? Мне нужно сделать поискового робота, которые будет бегать по ссылкам на странице, беря со страницы весь текст и деля его на слова и добавляя эти слова в базу данных.
0
|
|
|
|
|
| 25.03.2013, 12:18 | |
|
Например, проверяйте есть ли потомки у тех элементов, которые вы перебираете.
Есть нет - то добавляйте элемент к себе. Задача-то примитивная, у HAP очень неплохой API - изучите его и примеры чуть подробней. Должно все стать ясно.
0
|
|
| 25.03.2013, 12:18 | |
|
Помогаю со студенческими работами здесь
7
HtmlAgilityPack и Html страница со сложными таблицами Распарсить html теги или обойти их с XPath (HtmlAgilityPack) Парсинг HTML (HtmlAgilityPack). Как получить картинку между текстом? Работа с HtmlAgilityPack. В HTML разметке несколько таблиц, как получить только первую? Отпарсить html страницу (HtmlAgilityPack, xPath) Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает
монорепозиторий в котором находятся все исходники.
При создании нового решения, мы просто добавляем нужные проекты
и имеем. . .
|
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение:
В этой книге («Подход, основанный на вариантах использования») Ивар утверждает,
что архитектура программного обеспечения — это
структуры,. . .
|
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога
Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
|
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога
Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip
На первой гифке отладочные линии отключены, а на второй включены:. . .
|
|
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога
Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip Сканируйте QR-код на мобильном и вы увидите, что появится джойстик для управления главным героем.
. . .
|
Реалии
Hrethgir 01.03.2026
Нет, я не закончил до сих пор симулятор. Эта задача сложнее. Не получилось уйти в плавсостав, но оно и к лучшему, возможно. Точнее получалось - но сварщиком в палубную команду, а это значит, в моём. . .
|
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
|
SDL3 для Web (WebAssembly): Сборка библиотек: SDL3, Box2D, FreeType, SDL3_ttf, SDL3_mixer и SDL3_image из исходников с помощью CMake и Emscripten
8Observer8 27.02.2026
Недавно вышла версия 3. 4. 2 библиотеки SDL3. На странице официальной релиза доступны исходники, готовые DLL (для x86, x64, arm64), а также библиотеки для разработки под Android, MinGW и Visual Studio. . . .
|