|
0 / 0 / 0
Регистрация: 11.12.2017
Сообщений: 9
|
||||||
Не получается распарсить сайт08.11.2018, 16:47. Показов 3043. Ответов 16
Добрый день. Пересёрфил форумы в попытках найти помощь в парсинге сайтов. Изначально пользовался Regex, но как выяснилось, то это не лучший способ. После чего стал осваивать (пытаться) AngleSharp. Посмотрел форумы, вроде все было понятно. но на практике не работает...
В данном примере пытаюсь реализовать банальную вещь. Достать все даты публикации постов в теме на форуме. Делаю это через QuerySelectorAll, и заполняющийся List<string> найденными результатами. Делал все по примерам, урокам и т.д. но почему то когда я вывожу на экран размерность List<string>, то он пишет что пустой. Почему это так? с чем связано? как вывести на экран найденное при парсинге?
0
|
||||||
| 08.11.2018, 16:47 | |
|
Ответы с готовыми решениями:
16
Как распарсить сайт Как распарсить сайт Распарсить сайт с объявлениями |
|
814 / 561 / 240
Регистрация: 01.07.2018
Сообщений: 1,818
|
||||||
| 08.11.2018, 17:23 | ||||||
|
mr_mark_ru, Не знаю как AngleSharp, в HtmlAgilityPack это выглядит вот так:
1
|
||||||
|
0 / 0 / 0
Регистрация: 11.12.2017
Сообщений: 9
|
|
| 08.11.2018, 17:26 [ТС] | |
|
а можно в двух словах объяснить в чем разница между AngleSharp и HtmlAgilityPack? Я еще только выбираю платформу для парсинга, поэтому есть более удобные или лучшие варианты, я начну изучать их. просто AngleSharp первый кто попался на глаза, когда я убегал от Regex)
Ну а за ответ спасибо) попробую сейчас погуглить про HtmlAgilityPack, и посмотреть что он из себя преставляет
0
|
|
|
814 / 561 / 240
Регистрация: 01.07.2018
Сообщений: 1,818
|
|
| 08.11.2018, 17:29 | |
|
mr_mark_ru, Разницы большой нет. Но по HtmlAgilityPack инфы в сети намного больше. Так же рекомендую почитать вот это https://msiter.ru/tutorials/xpath
1
|
|
|
0 / 0 / 0
Регистрация: 11.12.2017
Сообщений: 9
|
||||||
| 08.11.2018, 17:38 [ТС] | ||||||
|
Хорошо, спасибо за материал, обязательно прочту. Но так как скоро уйду спать а перед сном хотелось бы что-нибудь сделать и запомнить не вникая в множество текстов, мог бы ты пояснить каждую из этих строчек?
Затем мы вводим стринг переменную для хранения ссылки на сайт и подгружаем эту ссылку к среде где хранится сайт. После чего вводим среду где будет хранится HTML код страницы. Потом Подгружаем туда страницу, код которой нам нужен. Ну и в конце описываем условия для поиска того чего нам нужно, которая будет хранится в nodes. Если я все правильно понял и описал выше, то тогда я не понимаю зачем нам первая строка? (прошу прощения что я возможно говорю глупые вещи, просто очень мне это любопытно и я в этом новечек. Но моё желание понять что-то заставляет меня писать порой глупые догадки)
0
|
||||||
|
814 / 561 / 240
Регистрация: 01.07.2018
Сообщений: 1,818
|
||||||
| 08.11.2018, 17:55 | ||||||
|
mr_mark_ru,
1
|
||||||
|
0 / 0 / 0
Регистрация: 11.12.2017
Сообщений: 9
|
|
| 08.11.2018, 17:59 [ТС] | |
|
Огромное спаибо за твою помощь. Но для расширения кругозора пусть тема еще повисит, и вдруг кто знает как решить возникшую у меня проблему. ну а раз пока получается на HtmlAgilityPack делать, то переберусь на него )
0
|
|
|
814 / 561 / 240
Регистрация: 01.07.2018
Сообщений: 1,818
|
||||||
| 08.11.2018, 18:06 | ||||||
|
mr_mark_ru, Так и на AngleSharp у вас работает. Только методу Parse нужно передавать строку с html, а не ссылку.
0
|
||||||
|
Администратор
|
|||||||
| 08.11.2018, 18:13 | |||||||
|
mr_mark_ru, твой код не работает потому что метод Parse принимает html, а не адрес страницы. Вот правильный код
0
|
|||||||
|
0 / 0 / 0
Регистрация: 11.12.2017
Сообщений: 9
|
||||||
| 08.11.2018, 18:16 [ТС] | ||||||
|
да, вот я сижу и сравниваю два эти парсера и у AngleSharp код по моему проще получается для усвоения. но все же это кому как наверное...
скопировал твой код к себе и у меня шарп ругается на это:
0
|
||||||
|
601 / 485 / 185
Регистрация: 19.04.2016
Сообщений: 1,885
|
|
| 08.11.2018, 18:19 | |
|
Даже в гите предложен вариант как скачивать...
AngleSharp Еще вариант Ну или воспользоваться иными средствами, под тип WebClient, но не как не .Parse(url)
0
|
|
|
814 / 561 / 240
Регистрация: 01.07.2018
Сообщений: 1,818
|
|
| 08.11.2018, 18:19 | |
|
1
|
|
|
Администратор
|
||||
| 08.11.2018, 18:22 | ||||
|
Добавлено через 26 секунд
0
|
||||
|
0 / 0 / 0
Регистрация: 11.12.2017
Сообщений: 9
|
|
| 08.11.2018, 18:24 [ТС] | |
|
проблема в том что я не понимаю о чем мне именно говорят в тексте ошибки) И где найти настройки компиляции?
0
|
|
|
Администратор
|
||||||
| 08.11.2018, 18:41 | ||||||
|
mr_mark_ru, раз такие трудности, то замени строку на
0
|
||||||
|
601 / 485 / 185
Регистрация: 19.04.2016
Сообщений: 1,885
|
|||||||||
| 08.11.2018, 18:43 | |||||||||
0
|
|||||||||
|
0 / 0 / 0
Регистрация: 11.12.2017
Сообщений: 9
|
|
| 08.11.2018, 18:53 [ТС] | |
|
Спасибо всем большое) теперь все работает и осталось только разобраться как дальше с этим плясать и как этим всем манипулировать и пользоваться)
0
|
|
| 08.11.2018, 18:53 | |
|
Помогаю со студенческими работами здесь
17
Не получается распарсить строку Не получается распарсить xml Не получается распарсить textBox Не получается распарсить урлы регуляркой Не получается распарсить страницу с помощью HtmlAgilityPack Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
SDL3 для Desktop (MinGW): Рисуем цветные прямоугольники с помощью рисовальщика SDL3 на Си и C++
8Observer8 17.03.2026
Содержание блога
Финальные проекты на Си и на C++:
finish-rectangles-sdl3-c. zip
finish-rectangles-sdl3-cpp. zip
|
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие.
Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
|
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ВВЕДЕНИЕ
Выполняя задание на управление насосной группой заполнения резервуара,. . .
|
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
|
|
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога
Финальные проекты на Си и на C++:
hello-sdl3-c. zip
hello-sdl3-cpp. zip
Результат:
|
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога
MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
|
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд.
Даже если у вас. . .
|
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает
монорепозиторий в котором находятся все исходники.
При создании нового решения, мы просто добавляем нужные проекты
и имеем. . .
|