|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
|
Парсинг сайтов с динамическими данными29.08.2022, 12:35. Показов 2258. Ответов 12
Метки нет (Все метки)
Всем привет
Два дня мучаюсь над одной проблемой, не могу решить и все, перерыл кучу информации, результат около нуля Задача: Нужно содрать данные с одного сайт, данные эти обновляются каждую секунду например https://www.boerse-frankfurt.de/index/dax котировка индекса DAX в середине страницы справа от графика текст страницы получаю через requests.get(url) беда в том что обновляемые данные не попадают, похоже не успевают запустить скрипты как получить эти данные, дайте пару советов через браузер они скачиваются нормально, сейчас изучаю селениум, я так понял что она мне может помочь, но каждый раз будет открываться браузер, это очень долго и затратно. я новичок, только познаю питон, поэтому сильно не ругайте Спасибо всем кто откликнулся.
0
|
|
| 29.08.2022, 12:35 | |
|
Ответы с готовыми решениями:
12
Шаблон с динамическими данными из MSSQL |
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
|
| 29.08.2022, 19:52 [ТС] | |
|
В общем решил что буду пробовать через selenium и PhantomJS
но столкнулся с проблемой код вот такой from selenium import webdriver написал самой первой строчкой в коде driver = webdriver.PhantomJS() Ошибка вот такая driver = webdriver.PhantomJS() AttributeError: module 'selenium.webdriver' has no attribute 'PhantomJS' в списке есть хромы, ие и прочие, phantomjs нету selenium и PhantomJS устанавливал pip install selenium pip install phantomjs что я не доустановил? хелп плиз
0
|
|
|
148 / 111 / 37
Регистрация: 28.11.2013
Сообщений: 383
|
||||||
| 30.08.2022, 19:11 | ||||||
|
Можно попробовать requests_html для обработки js скриптов, но не всегда работает. Но render страницы будет долгим как в селениуме. Что касается ваших данных, то у меня получилось так:
Кликните здесь для просмотра всего текста
Добавлено через 7 минут У меня requestами не всё удалось найти, догадываюсь, что часть данных вычисляется скриптами, а не посылается с сервера.
1
|
||||||
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
||||||
| 30.08.2022, 21:43 [ТС] | ||||||
|
Спасибо что откликнулся на мою проблему, но видимо я не корректно объяснил свою задачу
Исходя из вашего когда я понял что код формирует запрос к API и уже апи формирует таблицу мне же нужно именно спарсить страницу и извлечь из нее данные, они формируются без api [attach]https://www.cyberforum.ru/attachment.php?attachmentid=1365250&stc= 1&d=1661884287[/attach] я попробовал через render, но у меня ошибка и не могу с ней справиться
как все таки через рендер попробовать?
0
|
||||||
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
|
| 05.09.2022, 00:04 [ТС] | |
|
А какие еще варианты спарсить сайт с JS есть?
Seleniumу не все серваки доступ дают
0
|
|
|
87 / 95 / 15
Регистрация: 26.06.2013
Сообщений: 4,754
|
||
| 08.09.2022, 17:30 | ||
|
Добавлено через 56 секунд Имею в виду, если использовать fake модули.
0
|
||
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
|
| 08.09.2022, 22:23 [ТС] | |
|
supmener, не знаю, предположил просто
0
|
|
|
14145 / 9374 / 1350
Регистрация: 21.01.2016
Сообщений: 35,299
|
||
| 09.09.2022, 03:34 | ||
|
0
|
||
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
|
| 09.09.2022, 19:08 [ТС] | |
|
Usaga, через селениум в хроме открывал один сайт - так он ругнулся и спарсилась только сообщение эксесс денайд
исходя из это го предположил что как то отслеживают через что доступ
0
|
|
|
14145 / 9374 / 1350
Регистрация: 21.01.2016
Сообщений: 35,299
|
|
| 10.09.2022, 03:44 | |
|
bzda, предположение ошибочное.
0
|
|
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
||
| 24.01.2023, 21:32 [ТС] | ||
|
Я в хроме в дев консоли смотрел запросы, ничего подобного не нашел Или где и что почитать для изучения данной проблемы?
0
|
||
|
148 / 111 / 37
Регистрация: 28.11.2013
Сообщений: 383
|
|
| 26.01.2023, 00:22 | |
|
Какой конкретно запрос я отловил тогда, я уже не помню, но алгоритм действий такой:
1) копируем данные запроса как curl 2) Гуглим :"curl to python" 3) Вставляем код и копируем python со всеми запросами, нажав на кнопку "copy to clipboard".
1
|
|
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
|
| 26.01.2023, 13:26 [ТС] | |
|
блин, я думал как то в автомате это можно сделать, а тут получается нужно нужно выбрать из кучи запросов нужный и его уже колупать, да еще нужный запрос происходит с задержкой
вообще у меня был план такой через селениум заходим на по ссылке, от селениума получаем лог с запросом далее его сохраняем потом уже делаем запрос и изучаем данные которые пришли по нему
0
|
|
| 26.01.2023, 13:26 | |
|
Помогаю со студенческими работами здесь
13
Как сравнить таблицы с динамическими данными Создание кастомного календаря с динамическими данными Обмен данными между двумя динамическими массивами Работа с динамическими данными. Исключение элементов из списка. Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
| Опции темы | |
|
|
Новые блоги и статьи
|
|||
|
Символьное дифференцирование
igorrr37 13.02.2026
/ *
Логарифм записывается как: (x-2)log(x^2+2) - означает логарифм (x^2+2) по основанию (x-2).
Унарный минус обозначается как !
*/
#include <iostream>
#include <stack>
#include <cctype>. . .
|
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
|
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу,
и светлой Луне.
В мире
покоя нет
и люди
не могут жить в тишине.
А жить им немного лет.
|
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила»
«Время-Деньги»
«Деньги -Пуля»
|
|
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога
Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога
Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
|
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
|