|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
||||||
Парсинг сайта с javascript25.04.2020, 00:22. Показов 20333. Ответов 20
Метки нет (Все метки)
Я в этом деле новичок, возникла такая потребность.
С сайта https://1xstavka.ru/results/, нужно вытащить таблицы (раздел "баскетбол") в .csv файл, отдельно по каждой дате или задавать промежутком. Я так понимаю, таблица подгружается после нажатия кнопок на сайте (post/get запросы) Помогите или подскажите, как в python сформировать такие же запросы, чтобы получить html с развернутыми таблицами для парсинга. Никак не могу разобраться. Спасибо.
0
|
||||||
| 25.04.2020, 00:22 | |
|
Ответы с готовыми решениями:
20
Парсинг страницы со скриптами javascript Парсинг JavaScript кода (только инициализатор объектов) Парсинг сайта с JavaScript |
|
Автоматизируй это!
|
|
| 25.04.2020, 10:08 | |
|
badattitude, во-первых займись поиском тут, помнб помогали тут человеку с подобным, вроде даже тот же сайт, по крайней мере помню что игры какие-то. Нужно использовать не суп, а селениум если там скриптом все подгружается. Если все-же запросом, то повторяем эти запросы и парсим данные.
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|
| 25.04.2020, 13:08 [ТС] | |
|
Silenium очень долго, там нужен большой интервал по датам.
Вот именно, в формировании запросов проблема. Как их на requests сформировать или где про это подробно прочитать. Все облазил, везде только поверхностно написано, а именно откуда и как брать параметры запроса. В инструментах разработчика, нашёл нужные get - запросы. Чтобы сайт выдал нужные таблицы, надо по 3 кнопкам пройтись, получается 3 get запроса?
0
|
|
|
Автоматизируй это!
|
|||
| 25.04.2020, 13:10 | |||
|
2 поиском в гугле можно посмотреть как с вкладкой Нетворкс работать в инструментах разработчика Хром
0
|
|||
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|
| 25.04.2020, 13:19 [ТС] | |
|
Чтобы добраться до таблицы, сначала нажимаю кнопку "Баскетбол" (отправляется get запрос), выбор нужной даты (get запрос) и кнопка "развернуть" (get запрос). Только после этого в дереве html можно добраться до таблицы с результатами.
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|
| 25.04.2020, 22:38 [ТС] | |
|
Подскажите, как сформировать запросы или каким образом можно получить html код(кроме selenium'а), чтобы распарсить страницу. Никак не могу разобраться.
0
|
|
|
|
||
| 26.04.2020, 17:31 | ||
|
Сайт прекрасно отдает json по всем видам спорта.
Добавлено через 43 секунды
0
|
||
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|
| 27.04.2020, 01:18 [ТС] | |
|
У меня в этом и складывается вся проблема, сайт в контенте html/text, а прочитать функцией r.json() ответ, никак не могу.
Для меня это все в новинку, вот и задаю по видимому глупые вопросы. Объясните пожалуйста, в чтобы получить нужную страницу для Парсинга, мне какой запрос надо передать и как его сформировать(с заголовками и параметрами?).
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|||||||
| 27.04.2020, 23:08 [ТС] | |||||||
C:\Users\дом>"C:/Program Files/Python38/python.exe" c:/Users/дом/1xstavka.py Traceback (most recent call last): File "c:/Users/дом/1xstavka.py", line 13, in <module> print(response.json()) File "C:\Program Files\Python38\lib\site-packages\requests\models.py", line 898, in json return complexjson.loads(self.text, **kwargs) File "C:\Program Files\Python38\lib\json\__init__.py", line 357, in loads return _default_decoder.decode(s) File "C:\Program Files\Python38\lib\json\decoder.py", line 337, in decode obj, end = self.raw_decode(s, idx=_w(s, 0).end()) File "C:\Program Files\Python38\lib\json\decoder.py", line 355, in raw_decode raise JSONDecodeError("Expecting value", s, err.value) from None json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0) подскажите, в чем проблема или что делаю не так
0
|
|||||||
|
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
|
|
| 27.04.2020, 23:19 | |
|
может сервер отвечает не json-ом?
0
|
|
|
|
||
| 27.04.2020, 23:25 | ||
|
Логично предположить, что такой сайт просто не может работать иначе, оперируя в realtime таким объемом данных. Но по какому именно запросу - пускай ТС выясняет сам. На форуме это уже приводилось.
0
|
||
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
||
| 28.04.2020, 00:42 [ТС] | ||
|
0
|
||
|
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
|
|
| 28.04.2020, 00:57 | |
|
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|||||||||||||
| 28.04.2020, 16:05 [ТС] | |||||||||||||
|
Garry Galler,
И заголовки все тоже пробовал передавать, исход тот же Добавлено через 30 минут Garry Galler,
И заголовки все тоже пробовал передавать, исход тот же
0
|
|||||||||||||
|
|
|
| 28.04.2020, 16:08 | |
|
Поиск по форуму в разделе Python: 1xstavka.ru
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|
| 28.04.2020, 16:24 [ТС] | |
|
Надеюсь последний вопрос.
Каким образом формировать такие запросы и передавать им параметры? Большое спасибо за уже оказанную помощь.
0
|
|
|
|
|
| 28.04.2020, 17:25 | |
|
Вы что так и не нашли готовый пример?
Проблема с массивами JSON в python)
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
||||||
| 28.04.2020, 17:46 [ТС] | ||||||
|
Нашел, спасибо большое.
Но, все равно не могу разобраться с параметрами, как их задать, чтобы выдавал json с нужной датой
0
|
||||||
|
|
||
| 28.04.2020, 17:53 | ||
|
Разобраться в этих параметрах нельзя никаким иным способом, кроме самостоятельного тестирования каждого параметра. Потому что никакой открытой документации по ним не существует.
0
|
||
| 28.04.2020, 17:53 | |
|
Помогаю со студенческими работами здесь
20
Парсинг сайта с JavaScript
Парсинг данных с сайта с javascript Парсинг выполняемого JavaScript, JSON с сайта в программу С++
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
|
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11
— это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
|
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11
Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
|
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
|
|
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/
O1rJuneU_ls
https:/ / vkvideo. ru/ video-115721503_456239114
|
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ВВЕДЕНИЕ
Введу сокращения:
аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
|
Модель микоризы: классовый агентный подход 2
anaschu 06.01.2026
репозиторий https:/ / github. com/ shumilovas/ fungi
ветка по-частям.
коммит Create переделка под биомассу. txt
вход sc, но sm считается внутри мицелия. кстати, обьем тоже должен там считаться. . . .
|
Расчёт токов в цепи постоянного тока
igorrr37 05.01.2026
/ *
Дана цепь постоянного тока с сопротивлениями и напряжениями. Надо найти токи в ветвях.
Программа составляет систему уравнений по 1 и 2 законам Кирхгофа и решает её.
Последовательность действий:. . .
|