|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
|
Парсинг сайтов с динамическими данными29.08.2022, 12:35. Показов 2219. Ответов 12
Метки нет (Все метки)
Всем привет
Два дня мучаюсь над одной проблемой, не могу решить и все, перерыл кучу информации, результат около нуля Задача: Нужно содрать данные с одного сайт, данные эти обновляются каждую секунду например https://www.boerse-frankfurt.de/index/dax котировка индекса DAX в середине страницы справа от графика текст страницы получаю через requests.get(url) беда в том что обновляемые данные не попадают, похоже не успевают запустить скрипты как получить эти данные, дайте пару советов через браузер они скачиваются нормально, сейчас изучаю селениум, я так понял что она мне может помочь, но каждый раз будет открываться браузер, это очень долго и затратно. я новичок, только познаю питон, поэтому сильно не ругайте Спасибо всем кто откликнулся.
0
|
|
| 29.08.2022, 12:35 | |
|
Ответы с готовыми решениями:
12
Шаблон с динамическими данными из MSSQL |
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
|
| 29.08.2022, 19:52 [ТС] | |
|
В общем решил что буду пробовать через selenium и PhantomJS
но столкнулся с проблемой код вот такой from selenium import webdriver написал самой первой строчкой в коде driver = webdriver.PhantomJS() Ошибка вот такая driver = webdriver.PhantomJS() AttributeError: module 'selenium.webdriver' has no attribute 'PhantomJS' в списке есть хромы, ие и прочие, phantomjs нету selenium и PhantomJS устанавливал pip install selenium pip install phantomjs что я не доустановил? хелп плиз
0
|
|
|
148 / 111 / 37
Регистрация: 28.11.2013
Сообщений: 383
|
||||||
| 30.08.2022, 19:11 | ||||||
|
Можно попробовать requests_html для обработки js скриптов, но не всегда работает. Но render страницы будет долгим как в селениуме. Что касается ваших данных, то у меня получилось так:
Кликните здесь для просмотра всего текста
Добавлено через 7 минут У меня requestами не всё удалось найти, догадываюсь, что часть данных вычисляется скриптами, а не посылается с сервера.
1
|
||||||
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
||||||
| 30.08.2022, 21:43 [ТС] | ||||||
|
Спасибо что откликнулся на мою проблему, но видимо я не корректно объяснил свою задачу
Исходя из вашего когда я понял что код формирует запрос к API и уже апи формирует таблицу мне же нужно именно спарсить страницу и извлечь из нее данные, они формируются без api [attach]https://www.cyberforum.ru/attachment.php?attachmentid=1365250&stc= 1&d=1661884287[/attach] я попробовал через render, но у меня ошибка и не могу с ней справиться
как все таки через рендер попробовать?
0
|
||||||
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
|
| 05.09.2022, 00:04 [ТС] | |
|
А какие еще варианты спарсить сайт с JS есть?
Seleniumу не все серваки доступ дают
0
|
|
|
87 / 95 / 15
Регистрация: 26.06.2013
Сообщений: 4,753
|
||
| 08.09.2022, 17:30 | ||
|
Добавлено через 56 секунд Имею в виду, если использовать fake модули.
0
|
||
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
|
| 08.09.2022, 22:23 [ТС] | |
|
supmener, не знаю, предположил просто
0
|
|
|
14122 / 9341 / 1350
Регистрация: 21.01.2016
Сообщений: 35,102
|
||
| 09.09.2022, 03:34 | ||
|
0
|
||
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
|
| 09.09.2022, 19:08 [ТС] | |
|
Usaga, через селениум в хроме открывал один сайт - так он ругнулся и спарсилась только сообщение эксесс денайд
исходя из это го предположил что как то отслеживают через что доступ
0
|
|
|
14122 / 9341 / 1350
Регистрация: 21.01.2016
Сообщений: 35,102
|
|
| 10.09.2022, 03:44 | |
|
bzda, предположение ошибочное.
0
|
|
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
||
| 24.01.2023, 21:32 [ТС] | ||
|
Я в хроме в дев консоли смотрел запросы, ничего подобного не нашел Или где и что почитать для изучения данной проблемы?
0
|
||
|
148 / 111 / 37
Регистрация: 28.11.2013
Сообщений: 383
|
|
| 26.01.2023, 00:22 | |
|
Какой конкретно запрос я отловил тогда, я уже не помню, но алгоритм действий такой:
1) копируем данные запроса как curl 2) Гуглим :"curl to python" 3) Вставляем код и копируем python со всеми запросами, нажав на кнопку "copy to clipboard".
1
|
|
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
|
| 26.01.2023, 13:26 [ТС] | |
|
блин, я думал как то в автомате это можно сделать, а тут получается нужно нужно выбрать из кучи запросов нужный и его уже колупать, да еще нужный запрос происходит с задержкой
вообще у меня был план такой через селениум заходим на по ссылке, от селениума получаем лог с запросом далее его сохраняем потом уже делаем запрос и изучаем данные которые пришли по нему
0
|
|
| 26.01.2023, 13:26 | |
|
Помогаю со студенческими работами здесь
13
Как сравнить таблицы с динамическими данными Создание кастомного календаря с динамическими данными Обмен данными между двумя динамическими массивами Работа с динамическими данными. Исключение элементов из списка. Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
YAFU@home — распределённые вычисления для математики. На CPU
Programma_Boinc 20.01.2026
YAFU@home — распределённые вычисления для математики. На CPU
YAFU@home — это BOINC-проект, который занимается факторизацией больших чисел и исследованием aliquot-последовательностей.
Звучит. . .
|
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
|
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма).
На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
|
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ *
Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам
Кирхгофа, решает её и находит:
токи, напряжения и их 1 и 2 производные при t = 0;. . .
|
|
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым.
Но восстановить их можно так.
Для этого понадобится консольная утилита. . .
|
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
|
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11
— это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
|
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11
Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
|