|
0 / 0 / 0
Регистрация: 11.12.2017
Сообщений: 9
|
||||||
Не получается распарсить сайт08.11.2018, 16:47. Показов 3072. Ответов 16
Добрый день. Пересёрфил форумы в попытках найти помощь в парсинге сайтов. Изначально пользовался Regex, но как выяснилось, то это не лучший способ. После чего стал осваивать (пытаться) AngleSharp. Посмотрел форумы, вроде все было понятно. но на практике не работает...
В данном примере пытаюсь реализовать банальную вещь. Достать все даты публикации постов в теме на форуме. Делаю это через QuerySelectorAll, и заполняющийся List<string> найденными результатами. Делал все по примерам, урокам и т.д. но почему то когда я вывожу на экран размерность List<string>, то он пишет что пустой. Почему это так? с чем связано? как вывести на экран найденное при парсинге?
0
|
||||||
| 08.11.2018, 16:47 | |
|
Ответы с готовыми решениями:
16
Как распарсить сайт Как распарсить сайт Распарсить сайт с объявлениями |
|
814 / 561 / 240
Регистрация: 01.07.2018
Сообщений: 1,818
|
||||||
| 08.11.2018, 17:23 | ||||||
|
mr_mark_ru, Не знаю как AngleSharp, в HtmlAgilityPack это выглядит вот так:
1
|
||||||
|
0 / 0 / 0
Регистрация: 11.12.2017
Сообщений: 9
|
|
| 08.11.2018, 17:26 [ТС] | |
|
а можно в двух словах объяснить в чем разница между AngleSharp и HtmlAgilityPack? Я еще только выбираю платформу для парсинга, поэтому есть более удобные или лучшие варианты, я начну изучать их. просто AngleSharp первый кто попался на глаза, когда я убегал от Regex)
Ну а за ответ спасибо) попробую сейчас погуглить про HtmlAgilityPack, и посмотреть что он из себя преставляет
0
|
|
|
814 / 561 / 240
Регистрация: 01.07.2018
Сообщений: 1,818
|
|
| 08.11.2018, 17:29 | |
|
mr_mark_ru, Разницы большой нет. Но по HtmlAgilityPack инфы в сети намного больше. Так же рекомендую почитать вот это https://msiter.ru/tutorials/xpath
1
|
|
|
0 / 0 / 0
Регистрация: 11.12.2017
Сообщений: 9
|
||||||
| 08.11.2018, 17:38 [ТС] | ||||||
|
Хорошо, спасибо за материал, обязательно прочту. Но так как скоро уйду спать а перед сном хотелось бы что-нибудь сделать и запомнить не вникая в множество текстов, мог бы ты пояснить каждую из этих строчек?
Затем мы вводим стринг переменную для хранения ссылки на сайт и подгружаем эту ссылку к среде где хранится сайт. После чего вводим среду где будет хранится HTML код страницы. Потом Подгружаем туда страницу, код которой нам нужен. Ну и в конце описываем условия для поиска того чего нам нужно, которая будет хранится в nodes. Если я все правильно понял и описал выше, то тогда я не понимаю зачем нам первая строка? (прошу прощения что я возможно говорю глупые вещи, просто очень мне это любопытно и я в этом новечек. Но моё желание понять что-то заставляет меня писать порой глупые догадки)
0
|
||||||
|
814 / 561 / 240
Регистрация: 01.07.2018
Сообщений: 1,818
|
||||||
| 08.11.2018, 17:55 | ||||||
|
mr_mark_ru,
1
|
||||||
|
0 / 0 / 0
Регистрация: 11.12.2017
Сообщений: 9
|
|
| 08.11.2018, 17:59 [ТС] | |
|
Огромное спаибо за твою помощь. Но для расширения кругозора пусть тема еще повисит, и вдруг кто знает как решить возникшую у меня проблему. ну а раз пока получается на HtmlAgilityPack делать, то переберусь на него )
0
|
|
|
814 / 561 / 240
Регистрация: 01.07.2018
Сообщений: 1,818
|
||||||
| 08.11.2018, 18:06 | ||||||
|
mr_mark_ru, Так и на AngleSharp у вас работает. Только методу Parse нужно передавать строку с html, а не ссылку.
0
|
||||||
|
Администратор
|
|||||||
| 08.11.2018, 18:13 | |||||||
|
mr_mark_ru, твой код не работает потому что метод Parse принимает html, а не адрес страницы. Вот правильный код
0
|
|||||||
|
0 / 0 / 0
Регистрация: 11.12.2017
Сообщений: 9
|
||||||
| 08.11.2018, 18:16 [ТС] | ||||||
|
да, вот я сижу и сравниваю два эти парсера и у AngleSharp код по моему проще получается для усвоения. но все же это кому как наверное...
скопировал твой код к себе и у меня шарп ругается на это:
0
|
||||||
|
601 / 485 / 185
Регистрация: 19.04.2016
Сообщений: 1,885
|
|
| 08.11.2018, 18:19 | |
|
Даже в гите предложен вариант как скачивать...
AngleSharp Еще вариант Ну или воспользоваться иными средствами, под тип WebClient, но не как не .Parse(url)
0
|
|
|
814 / 561 / 240
Регистрация: 01.07.2018
Сообщений: 1,818
|
|
| 08.11.2018, 18:19 | |
|
1
|
|
|
Администратор
|
||||
| 08.11.2018, 18:22 | ||||
|
Добавлено через 26 секунд
0
|
||||
|
0 / 0 / 0
Регистрация: 11.12.2017
Сообщений: 9
|
|
| 08.11.2018, 18:24 [ТС] | |
|
проблема в том что я не понимаю о чем мне именно говорят в тексте ошибки) И где найти настройки компиляции?
0
|
|
|
Администратор
|
||||||
| 08.11.2018, 18:41 | ||||||
|
mr_mark_ru, раз такие трудности, то замени строку на
0
|
||||||
|
601 / 485 / 185
Регистрация: 19.04.2016
Сообщений: 1,885
|
|||||||||
| 08.11.2018, 18:43 | |||||||||
0
|
|||||||||
|
0 / 0 / 0
Регистрация: 11.12.2017
Сообщений: 9
|
|
| 08.11.2018, 18:53 [ТС] | |
|
Спасибо всем большое) теперь все работает и осталось только разобраться как дальше с этим плясать и как этим всем манипулировать и пользоваться)
0
|
|
| 08.11.2018, 18:53 | |
|
Помогаю со студенческими работами здесь
17
Не получается распарсить строку Не получается распарсить xml Не получается распарсить textBox Не получается распарсить урлы регуляркой Не получается распарсить страницу с помощью HtmlAgilityPack Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
| Опции темы | |
|
|
Новые блоги и статьи
|
|||
|
Отчёт о затраченных материалах за определенный период с макетом печатной формы
Maks 21.04.2026
Отчёт из решения ниже размещён в конфигурации КА2.
Задача: разработка отчёта по затраченным материалам за определённый период, с возможностью вывода печатной формы отчёта с шапкой и подвалом.
В. . .
|
Отчёт о спецтехнике находящейся в ремонте
Maks 20.04.2026
Отчёт из решения ниже размещен в конфигурации КА2.
Задача: отобразить спецтехнику, которая на данный момент находится в ремонте.
Есть нетиповой документ "Заявка на ремонт спецтехники" который. . .
|
Памятка для бота и "визитка" для читателей "Semantic Universe Layer (Слой семантической вселенной)"
Hrethgir 19.04.2026
Сгенерировано для краткого описания по случаю сборки и компиляции скелета серверного приложения. И пусть после этого скажут, что статьи сгенерированные AI - туфта и не интересно. И это не реклама -. . .
|
Запрет удаления строк ТЧ документа при определённом условии
Maks 19.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "Аккумуляторы", разработанного в конфигурации КА2. У данного документа есть ТЧ, в которой в зависимости от прав доступа. . .
|
|
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут
Суть:
- Группа наркоманов из 10 человек.
- Только один инфицирован ВИЧ.
- Колются одной иглой.
- Колются раз в день.
- Колются последовательно через. . .
|
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
|
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
|
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . .
а удачный момент так и не приходит.
|