|
0 / 0 / 0
Регистрация: 03.05.2016
Сообщений: 22
|
|||||||||||
AngleSharp and JS01.12.2018, 14:38. Показов 8230. Ответов 10
Метки anglesharp (Все метки)
Доброго времени суток.
Делаю парсер с использованием AngleSharp. Столкнулся с проблемой, что не могу распарсить элементы, которые формируются с помощью скрипта. Пробовал так, как в примере на гитхабе, результат все тот же
Подскажите, можно все таки распарсить страницу, с помощью AngleSharp, после выполнения скриптов?
0
|
|||||||||||
| 01.12.2018, 14:38 | |
|
Ответы с готовыми решениями:
10
Авторизация на AngleSharp Парсинг на AngleSharp
|
|
4694 / 2702 / 734
Регистрация: 02.08.2011
Сообщений: 7,228
|
|
| 01.12.2018, 14:44 | |
|
Я не лазил в доку по AngleSharp, но кажется, что этот кусок
WithJavaScript().WithCss() говорит, что css и js также надо идентифицировать, но исполняться то он не будет.Вам нужно выполнить js, чтобы сгенерировать динамические данные. Воспользуейтесь Selenium. Из него уже вытаскивайте данные под парсинг.
1
|
|
|
0 / 0 / 0
Регистрация: 03.05.2016
Сообщений: 22
|
|||
| 01.12.2018, 14:53 [ТС] | |||
0
|
|||
|
814 / 561 / 240
Регистрация: 01.07.2018
Сообщений: 1,818
|
|
| 01.12.2018, 14:56 | |
|
flashsleep, Страницу покажите и какие элементы вы ищите.
1
|
|
|
0 / 0 / 0
Регистрация: 03.05.2016
Сообщений: 22
|
|
| 01.12.2018, 15:00 [ТС] | |
|
Страница - https://1xstavka.ru/live/Footb... sk-Akhmat/
Элементы - заголовки ставок - "Тотал, Фора и т.д."
0
|
|
|
4694 / 2702 / 734
Регистрация: 02.08.2011
Сообщений: 7,228
|
||
| 01.12.2018, 15:08 | ||
|
flashsleep, ну ок, ну так в примере config с установкой на выполнения js-а передается в HtmlParser, а не в BrowsingContext
1
|
||
|
0 / 0 / 0
Регистрация: 03.05.2016
Сообщений: 22
|
||||||
| 01.12.2018, 15:13 [ТС] | ||||||
|
IamRain, Пробовал, результат тот же, в document.DocumentElement.OuterHtml так же хранится скриптом и этих элементов нет. Пробовал так эе создавать новый экземпляр config
0
|
||||||
|
Администратор
|
|
| 02.12.2018, 19:01 | |
Сообщение было отмечено flashsleep как решение
Решение
flashsleep, насколько мне известно поддержка JS в AngleSharp очень ограниченная. Автор библиотеки стремился продемонстрировать возможность выполнения JS, но полноценную реализацию не написал. Поэтому необходимо использовать какой-либо браузерный движок. Например уже упомянутый Selenium или стандартный компонент WebBrowser.
1
|
|
|
0 / 0 / 0
Регистрация: 03.05.2016
Сообщений: 22
|
|
| 03.12.2018, 09:32 [ТС] | |
|
Спасибо за ответы. Если не сложно, подскажите еще 1 момент. Если покопать в сторону Jint, можно ли будет на нем выполнить скрипты с сайта и в дальнейшем получить код страницы?
0
|
|
|
Администратор
|
|
| 03.12.2018, 15:46 | |
|
flashsleep, чтобы ответить на этот вопрос нужно именно покопать на практике и тогда станет ясно получится или нет. Перед этим советую попробовать более простой способ который используют в подобных ситуациях. Вполне вероятно что скрипт запрашивает данные с сервера. Нужно посмотреть какие http запросы выполняются во время загрузки страницы и попробовать найти там необходимые данные. Затем запрашивать из кода эту страницу и парсить данные.
1
|
|
|
0 / 0 / 0
Регистрация: 03.05.2016
Сообщений: 22
|
|
| 03.12.2018, 20:45 [ТС] | |
|
OwenGlendower, Да, спасибо, подумал уже об этом, когда читал про Jint)
0
|
|
| 03.12.2018, 20:45 | |
|
Помогаю со студенческими работами здесь
11
Парсинг таблицы AngleSharp Парсинг через AngleSharp
Как парсить страницу на AngleSharp?
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути
Programma_Boinc 01.01.2026
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути
Сочетание глобально распределённой вычислительной мощности и инновационных. . .
|
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Налог на собак: https:/ / **********/ gallery/ V06K53e
Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf
Пост отсюда. . .
|
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop?
Ниже её машинный перевод.
После долгих разбирательств я наконец-то вернула себе. . .
|
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод
Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод.
Thinkpad X220 Tablet —. . .
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
|
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|