|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
||||||
Парсинг сайта с javascript25.04.2020, 00:22. Показов 20457. Ответов 20
Метки нет (Все метки)
Я в этом деле новичок, возникла такая потребность.
С сайта https://1xstavka.ru/results/, нужно вытащить таблицы (раздел "баскетбол") в .csv файл, отдельно по каждой дате или задавать промежутком. Я так понимаю, таблица подгружается после нажатия кнопок на сайте (post/get запросы) Помогите или подскажите, как в python сформировать такие же запросы, чтобы получить html с развернутыми таблицами для парсинга. Никак не могу разобраться. Спасибо.
0
|
||||||
| 25.04.2020, 00:22 | |
|
Ответы с готовыми решениями:
20
Парсинг страницы со скриптами javascript Парсинг JavaScript кода (только инициализатор объектов) Парсинг сайта с JavaScript |
|
Автоматизируй это!
|
|
| 25.04.2020, 10:08 | |
|
badattitude, во-первых займись поиском тут, помнб помогали тут человеку с подобным, вроде даже тот же сайт, по крайней мере помню что игры какие-то. Нужно использовать не суп, а селениум если там скриптом все подгружается. Если все-же запросом, то повторяем эти запросы и парсим данные.
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|
| 25.04.2020, 13:08 [ТС] | |
|
Silenium очень долго, там нужен большой интервал по датам.
Вот именно, в формировании запросов проблема. Как их на requests сформировать или где про это подробно прочитать. Все облазил, везде только поверхностно написано, а именно откуда и как брать параметры запроса. В инструментах разработчика, нашёл нужные get - запросы. Чтобы сайт выдал нужные таблицы, надо по 3 кнопкам пройтись, получается 3 get запроса?
0
|
|
|
Автоматизируй это!
|
|||
| 25.04.2020, 13:10 | |||
|
2 поиском в гугле можно посмотреть как с вкладкой Нетворкс работать в инструментах разработчика Хром
0
|
|||
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|
| 25.04.2020, 13:19 [ТС] | |
|
Чтобы добраться до таблицы, сначала нажимаю кнопку "Баскетбол" (отправляется get запрос), выбор нужной даты (get запрос) и кнопка "развернуть" (get запрос). Только после этого в дереве html можно добраться до таблицы с результатами.
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|
| 25.04.2020, 22:38 [ТС] | |
|
Подскажите, как сформировать запросы или каким образом можно получить html код(кроме selenium'а), чтобы распарсить страницу. Никак не могу разобраться.
0
|
|
|
|
||
| 26.04.2020, 17:31 | ||
|
Сайт прекрасно отдает json по всем видам спорта.
Добавлено через 43 секунды
0
|
||
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|
| 27.04.2020, 01:18 [ТС] | |
|
У меня в этом и складывается вся проблема, сайт в контенте html/text, а прочитать функцией r.json() ответ, никак не могу.
Для меня это все в новинку, вот и задаю по видимому глупые вопросы. Объясните пожалуйста, в чтобы получить нужную страницу для Парсинга, мне какой запрос надо передать и как его сформировать(с заголовками и параметрами?).
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|||||||
| 27.04.2020, 23:08 [ТС] | |||||||
C:\Users\дом>"C:/Program Files/Python38/python.exe" c:/Users/дом/1xstavka.py Traceback (most recent call last): File "c:/Users/дом/1xstavka.py", line 13, in <module> print(response.json()) File "C:\Program Files\Python38\lib\site-packages\requests\models.py", line 898, in json return complexjson.loads(self.text, **kwargs) File "C:\Program Files\Python38\lib\json\__init__.py", line 357, in loads return _default_decoder.decode(s) File "C:\Program Files\Python38\lib\json\decoder.py", line 337, in decode obj, end = self.raw_decode(s, idx=_w(s, 0).end()) File "C:\Program Files\Python38\lib\json\decoder.py", line 355, in raw_decode raise JSONDecodeError("Expecting value", s, err.value) from None json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0) подскажите, в чем проблема или что делаю не так
0
|
|||||||
|
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
|
|
| 27.04.2020, 23:19 | |
|
может сервер отвечает не json-ом?
0
|
|
|
|
||
| 27.04.2020, 23:25 | ||
|
Логично предположить, что такой сайт просто не может работать иначе, оперируя в realtime таким объемом данных. Но по какому именно запросу - пускай ТС выясняет сам. На форуме это уже приводилось.
0
|
||
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
||
| 28.04.2020, 00:42 [ТС] | ||
|
0
|
||
|
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
|
|
| 28.04.2020, 00:57 | |
|
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|||||||||||||
| 28.04.2020, 16:05 [ТС] | |||||||||||||
|
Garry Galler,
И заголовки все тоже пробовал передавать, исход тот же Добавлено через 30 минут Garry Galler,
И заголовки все тоже пробовал передавать, исход тот же
0
|
|||||||||||||
|
|
|
| 28.04.2020, 16:08 | |
|
Поиск по форуму в разделе Python: 1xstavka.ru
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|
| 28.04.2020, 16:24 [ТС] | |
|
Надеюсь последний вопрос.
Каким образом формировать такие запросы и передавать им параметры? Большое спасибо за уже оказанную помощь.
0
|
|
|
|
|
| 28.04.2020, 17:25 | |
|
Вы что так и не нашли готовый пример?
Проблема с массивами JSON в python)
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
||||||
| 28.04.2020, 17:46 [ТС] | ||||||
|
Нашел, спасибо большое.
Но, все равно не могу разобраться с параметрами, как их задать, чтобы выдавал json с нужной датой
0
|
||||||
|
|
||
| 28.04.2020, 17:53 | ||
|
Разобраться в этих параметрах нельзя никаким иным способом, кроме самостоятельного тестирования каждого параметра. Потому что никакой открытой документации по ним не существует.
0
|
||
| 28.04.2020, 17:53 | |
|
Помогаю со студенческими работами здесь
20
Парсинг сайта с JavaScript
Парсинг данных с сайта с javascript Парсинг выполняемого JavaScript, JSON с сайта в программу С++
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
SDL3 для Desktop (MinGW): Рисуем цветные прямоугольники с помощью рисовальщика SDL3 на Си и C++
8Observer8 17.03.2026
Содержание блога
Финальные проекты на Си и на C++:
finish-rectangles-sdl3-c. zip
finish-rectangles-sdl3-cpp. zip
|
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие.
Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
|
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ВВЕДЕНИЕ
Выполняя задание на управление насосной группой заполнения резервуара,. . .
|
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
|
|
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога
Финальные проекты на Си и на C++:
hello-sdl3-c. zip
hello-sdl3-cpp. zip
Результат:
|
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога
MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
|
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд.
Даже если у вас. . .
|
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает
монорепозиторий в котором находятся все исходники.
При создании нового решения, мы просто добавляем нужные проекты
и имеем. . .
|