|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
||||||
Парсинг сайта с javascript25.04.2020, 00:22. Показов 20503. Ответов 20
Метки нет (Все метки)
Я в этом деле новичок, возникла такая потребность.
С сайта https://1xstavka.ru/results/, нужно вытащить таблицы (раздел "баскетбол") в .csv файл, отдельно по каждой дате или задавать промежутком. Я так понимаю, таблица подгружается после нажатия кнопок на сайте (post/get запросы) Помогите или подскажите, как в python сформировать такие же запросы, чтобы получить html с развернутыми таблицами для парсинга. Никак не могу разобраться. Спасибо.
0
|
||||||
| 25.04.2020, 00:22 | |
|
Ответы с готовыми решениями:
20
Парсинг страницы со скриптами javascript Парсинг JavaScript кода (только инициализатор объектов) Парсинг сайта с JavaScript |
|
Автоматизируй это!
|
|
| 25.04.2020, 10:08 | |
|
badattitude, во-первых займись поиском тут, помнб помогали тут человеку с подобным, вроде даже тот же сайт, по крайней мере помню что игры какие-то. Нужно использовать не суп, а селениум если там скриптом все подгружается. Если все-же запросом, то повторяем эти запросы и парсим данные.
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|
| 25.04.2020, 13:08 [ТС] | |
|
Silenium очень долго, там нужен большой интервал по датам.
Вот именно, в формировании запросов проблема. Как их на requests сформировать или где про это подробно прочитать. Все облазил, везде только поверхностно написано, а именно откуда и как брать параметры запроса. В инструментах разработчика, нашёл нужные get - запросы. Чтобы сайт выдал нужные таблицы, надо по 3 кнопкам пройтись, получается 3 get запроса?
0
|
|
|
Автоматизируй это!
|
|||
| 25.04.2020, 13:10 | |||
|
2 поиском в гугле можно посмотреть как с вкладкой Нетворкс работать в инструментах разработчика Хром
0
|
|||
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|
| 25.04.2020, 13:19 [ТС] | |
|
Чтобы добраться до таблицы, сначала нажимаю кнопку "Баскетбол" (отправляется get запрос), выбор нужной даты (get запрос) и кнопка "развернуть" (get запрос). Только после этого в дереве html можно добраться до таблицы с результатами.
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|
| 25.04.2020, 22:38 [ТС] | |
|
Подскажите, как сформировать запросы или каким образом можно получить html код(кроме selenium'а), чтобы распарсить страницу. Никак не могу разобраться.
0
|
|
|
|
||
| 26.04.2020, 17:31 | ||
|
Сайт прекрасно отдает json по всем видам спорта.
Добавлено через 43 секунды
0
|
||
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|
| 27.04.2020, 01:18 [ТС] | |
|
У меня в этом и складывается вся проблема, сайт в контенте html/text, а прочитать функцией r.json() ответ, никак не могу.
Для меня это все в новинку, вот и задаю по видимому глупые вопросы. Объясните пожалуйста, в чтобы получить нужную страницу для Парсинга, мне какой запрос надо передать и как его сформировать(с заголовками и параметрами?).
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|||||||
| 27.04.2020, 23:08 [ТС] | |||||||
C:\Users\дом>"C:/Program Files/Python38/python.exe" c:/Users/дом/1xstavka.py Traceback (most recent call last): File "c:/Users/дом/1xstavka.py", line 13, in <module> print(response.json()) File "C:\Program Files\Python38\lib\site-packages\requests\models.py", line 898, in json return complexjson.loads(self.text, **kwargs) File "C:\Program Files\Python38\lib\json\__init__.py", line 357, in loads return _default_decoder.decode(s) File "C:\Program Files\Python38\lib\json\decoder.py", line 337, in decode obj, end = self.raw_decode(s, idx=_w(s, 0).end()) File "C:\Program Files\Python38\lib\json\decoder.py", line 355, in raw_decode raise JSONDecodeError("Expecting value", s, err.value) from None json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0) подскажите, в чем проблема или что делаю не так
0
|
|||||||
|
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
|
|
| 27.04.2020, 23:19 | |
|
может сервер отвечает не json-ом?
0
|
|
|
|
||
| 27.04.2020, 23:25 | ||
|
Логично предположить, что такой сайт просто не может работать иначе, оперируя в realtime таким объемом данных. Но по какому именно запросу - пускай ТС выясняет сам. На форуме это уже приводилось.
0
|
||
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
||
| 28.04.2020, 00:42 [ТС] | ||
|
0
|
||
|
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
|
|
| 28.04.2020, 00:57 | |
|
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|||||||||||||
| 28.04.2020, 16:05 [ТС] | |||||||||||||
|
Garry Galler,
И заголовки все тоже пробовал передавать, исход тот же Добавлено через 30 минут Garry Galler,
И заголовки все тоже пробовал передавать, исход тот же
0
|
|||||||||||||
|
|
|
| 28.04.2020, 16:08 | |
|
Поиск по форуму в разделе Python: 1xstavka.ru
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|
| 28.04.2020, 16:24 [ТС] | |
|
Надеюсь последний вопрос.
Каким образом формировать такие запросы и передавать им параметры? Большое спасибо за уже оказанную помощь.
0
|
|
|
|
|
| 28.04.2020, 17:25 | |
|
Вы что так и не нашли готовый пример?
Проблема с массивами JSON в python)
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
||||||
| 28.04.2020, 17:46 [ТС] | ||||||
|
Нашел, спасибо большое.
Но, все равно не могу разобраться с параметрами, как их задать, чтобы выдавал json с нужной датой
0
|
||||||
|
|
||
| 28.04.2020, 17:53 | ||
|
Разобраться в этих параметрах нельзя никаким иным способом, кроме самостоятельного тестирования каждого параметра. Потому что никакой открытой документации по ним не существует.
0
|
||
| 28.04.2020, 17:53 | |
|
Помогаю со студенческими работами здесь
20
Парсинг сайта с JavaScript
Парсинг данных с сайта с javascript Парсинг выполняемого JavaScript, JSON с сайта в программу С++
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут
Суть:
- Группа наркоманов из 10 человек.
- Только один инфицирован ВИЧ.
- Колются одной иглой.
- Колются раз в день.
- Колются последовательно через. . .
|
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
|
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
|
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . .
а удачный момент так и не приходит.
|
|
Фиксация колонок в отчете СКД
Maks 14.04.2026
Фиксация колонок в СКД отчета типа Таблица.
Задача: зафиксировать три левых колонки в отчете.
Процедура ПриКомпоновкеРезультата(ДокументРезультат, ДанныеРасшифровки, СтандартнаяОбработка)
/ / . . .
|
Настройки VS Code
Loafer 13.04.2026
{
"cmake. configureOnOpen": false,
"diffEditor. ignoreTrimWhitespace": true,
"editor. guides. bracketPairs": "active",
"extensions. ignoreRecommendations": true,
. . .
|
Оптимизация кода на разграничение прав доступа к элементам формы
Maks 13.04.2026
Алгоритм из решения ниже реализован на нетиповом документе, разработанного в конфигурации КА2.
Задачи, как таковой, поставлено не было, проделанное ниже исключительно моя инициатива.
Было так:. . .
|
Контроль заполнения и очистка дат в зависимости от значения перечислений
Maks 12.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2.
Задача: реализовать контроль корректности заполнения дат назначения. . .
|