|
0 / 0 / 0
Регистрация: 23.03.2013
Сообщений: 20
|
||||||||||||||||
Выбор дочерних HTML элементов через HtmlAgilityPack23.03.2013, 17:57. Показов 2665. Ответов 6
Метки нет (Все метки)
Добрый день. Я новичок в C#, поэтому не могу разобраться с таким моментом. В Python существует библиотека BeautifulSoup для парсинга html-страниц. Там есть такая функция. Можно ли что-то подобное сделать при помощи HtmlAgilityPack. Я пробовал через
0
|
||||||||||||||||
| 23.03.2013, 17:57 | |
|
Ответы с готовыми решениями:
6
Какие-то странности с html, из-за этого трудности с парсингом в HtmlAgilityPack.dll Парсинг HTML и htmlagilitypack Спарсить курс валюты из Html с HtmlAgilityPack |
|
169 / 132 / 29
Регистрация: 16.02.2013
Сообщений: 867
|
|
| 23.03.2013, 21:27 | |
|
а с помощью регулярок не лучше?
0
|
|
|
352 / 331 / 49
Регистрация: 12.12.2011
Сообщений: 563
|
|||||||||||
| 23.03.2013, 21:54 | |||||||||||
|
Не совсем понял вопроса, или даже совсем не понял но вот что получилось
Выведет содержимое всех параграфов на странице, без тегов
0
|
|||||||||||
|
0 / 0 / 0
Регистрация: 23.03.2013
Сообщений: 20
|
||||||||||||
| 24.03.2013, 19:18 [ТС] | ||||||||||||
0
|
||||||||||||
|
352 / 331 / 49
Регистрация: 12.12.2011
Сообщений: 563
|
||||||||||||||||||||||||||||||||||||
| 24.03.2013, 21:00 | ||||||||||||||||||||||||||||||||||||
|
heliogracie, потому что HTML разметка имеет древовидную структуру
Например мы имеем документ вот такой структуры
след. итерация
0
|
||||||||||||||||||||||||||||||||||||
|
0 / 0 / 0
Регистрация: 23.03.2013
Сообщений: 20
|
|
| 25.03.2013, 10:51 [ТС] | |
|
Yukikaze, неужели нет никакого способа извлечь html-код без повторов? Мне нужно сделать поискового робота, которые будет бегать по ссылкам на странице, беря со страницы весь текст и деля его на слова и добавляя эти слова в базу данных.
0
|
|
|
|
|
| 25.03.2013, 12:18 | |
|
Например, проверяйте есть ли потомки у тех элементов, которые вы перебираете.
Есть нет - то добавляйте элемент к себе. Задача-то примитивная, у HAP очень неплохой API - изучите его и примеры чуть подробней. Должно все стать ясно.
0
|
|
| 25.03.2013, 12:18 | |
|
Помогаю со студенческими работами здесь
7
HtmlAgilityPack и Html страница со сложными таблицами Распарсить html теги или обойти их с XPath (HtmlAgilityPack) Парсинг HTML (HtmlAgilityPack). Как получить картинку между текстом? Работа с HtmlAgilityPack. В HTML разметке несколько таблиц, как получить только первую? Отпарсить html страницу (HtmlAgilityPack, xPath) Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
| Опции темы | |
|
|
Новые блоги и статьи
|
|||
|
Отчёт о спецтехнике находящейся в ремонте
Maks 20.04.2026
Отчёт из решения ниже размещен в конфигурации КА2.
Задача: отобразить спецтехнику, которая на данный момент находится в ремонте.
Есть нетиповой документ "Заявка на ремонт спецтехники" который. . .
|
Памятка для бота и "визитка" для читателей "Semantic Universe Layer (Слой семантической вселенной)"
Hrethgir 19.04.2026
Сгенерировано для краткого описания по случаю сборки и компиляции скелета серверного приложения. И пусть после этого скажут, что статьи сгенерированные AI - туфта и не интересно. И это не реклама -. . .
|
Запрет удаления строк ТЧ документа при определенном условии
Maks 19.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "Аккумуляторы", разработанного в конфигурации КА2. У данного документа есть ТЧ, в которой в зависимости от прав доступа. . .
|
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут
Суть:
- Группа наркоманов из 10 человек.
- Только один инфицирован ВИЧ.
- Колются одной иглой.
- Колются раз в день.
- Колются последовательно через. . .
|
|
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
|
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
|
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . .
а удачный момент так и не приходит.
|
Фиксация колонок в отчете СКД
Maks 14.04.2026
Фиксация колонок в СКД отчета типа Таблица.
Задача: зафиксировать три левых колонки в отчете.
Процедура ПриКомпоновкеРезультата(ДокументРезультат, ДанныеРасшифровки, СтандартнаяОбработка)
/ / . . .
|