|
0 / 0 / 0
Регистрация: 23.03.2013
Сообщений: 20
|
||||||||||||||||
Выбор дочерних HTML элементов через HtmlAgilityPack23.03.2013, 17:57. Показов 2610. Ответов 6
Метки нет (Все метки)
Добрый день. Я новичок в C#, поэтому не могу разобраться с таким моментом. В Python существует библиотека BeautifulSoup для парсинга html-страниц. Там есть такая функция. Можно ли что-то подобное сделать при помощи HtmlAgilityPack. Я пробовал через
0
|
||||||||||||||||
| 23.03.2013, 17:57 | |
|
Ответы с готовыми решениями:
6
Какие-то странности с html, из-за этого трудности с парсингом в HtmlAgilityPack.dll Парсинг HTML и htmlagilitypack Спарсить курс валюты из Html с HtmlAgilityPack |
|
169 / 132 / 29
Регистрация: 16.02.2013
Сообщений: 867
|
|
| 23.03.2013, 21:27 | |
|
а с помощью регулярок не лучше?
0
|
|
|
352 / 331 / 49
Регистрация: 12.12.2011
Сообщений: 563
|
|||||||||||
| 23.03.2013, 21:54 | |||||||||||
|
Не совсем понял вопроса, или даже совсем не понял но вот что получилось
Выведет содержимое всех параграфов на странице, без тегов
0
|
|||||||||||
|
0 / 0 / 0
Регистрация: 23.03.2013
Сообщений: 20
|
||||||||||||
| 24.03.2013, 19:18 [ТС] | ||||||||||||
0
|
||||||||||||
|
352 / 331 / 49
Регистрация: 12.12.2011
Сообщений: 563
|
||||||||||||||||||||||||||||||||||||
| 24.03.2013, 21:00 | ||||||||||||||||||||||||||||||||||||
|
heliogracie, потому что HTML разметка имеет древовидную структуру
Например мы имеем документ вот такой структуры
след. итерация
0
|
||||||||||||||||||||||||||||||||||||
|
0 / 0 / 0
Регистрация: 23.03.2013
Сообщений: 20
|
|
| 25.03.2013, 10:51 [ТС] | |
|
Yukikaze, неужели нет никакого способа извлечь html-код без повторов? Мне нужно сделать поискового робота, которые будет бегать по ссылкам на странице, беря со страницы весь текст и деля его на слова и добавляя эти слова в базу данных.
0
|
|
|
|
|
| 25.03.2013, 12:18 | |
|
Например, проверяйте есть ли потомки у тех элементов, которые вы перебираете.
Есть нет - то добавляйте элемент к себе. Задача-то примитивная, у HAP очень неплохой API - изучите его и примеры чуть подробней. Должно все стать ясно.
0
|
|
| 25.03.2013, 12:18 | |
|
Помогаю со студенческими работами здесь
7
HtmlAgilityPack и Html страница со сложными таблицами Распарсить html теги или обойти их с XPath (HtmlAgilityPack) Парсинг HTML (HtmlAgilityPack). Как получить картинку между текстом? Работа с HtmlAgilityPack. В HTML разметке несколько таблиц, как получить только первую? Отпарсить html страницу (HtmlAgilityPack, xPath) Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/
O1rJuneU_ls
https:/ / vkvideo. ru/ video-115721503_456239114
|
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ВВЕДЕНИЕ
Введу сокращения:
аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
|
Модель микоризы: классовый агентный подход 2
anaschu 06.01.2026
репозиторий https:/ / github. com/ shumilovas/ fungi
ветка по-частям.
коммит Create переделка под биомассу. txt
вход sc, но sm считается внутри мицелия. кстати, обьем тоже должен там считаться. . . .
|
Расчёт токов в цепи постоянного тока
igorrr37 05.01.2026
/ *
Дана цепь постоянного тока с сопротивлениями и напряжениями. Надо найти токи в ветвях.
Программа составляет систему уравнений по 1 и 2 законам Кирхгофа и решает её.
Последовательность действий:. . .
|
|
Новый CodeBlocs. Версия 25.03
palva 04.01.2026
Оказывается, недавно вышла новая версия CodeBlocks за номером 25. 03. Когда-то давно я возился с только что вышедшей тогда версией 20. 03. С тех пор я давно снёс всё с компьютера и забыл. Теперь. . .
|
Модель микоризы: классовый агентный подход
anaschu 02.01.2026
Раньше это было два гриба и бактерия. Теперь три гриба, растение.
И на уровне агентов добавится между грибами или бактериями взаимодействий.
До того я пробовал подход через многомерные массивы,. . .
|
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Налог на собак: https:/ / **********/ gallery/ V06K53e
Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf
Пост отсюда. . .
|
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop?
Ниже её машинный перевод.
После долгих разбирательств я наконец-то вернула себе. . .
|