|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
|
Парсинг сайтов с динамическими данными29.08.2022, 12:35. Показов 2330. Ответов 12
Метки нет (Все метки)
Всем привет
Два дня мучаюсь над одной проблемой, не могу решить и все, перерыл кучу информации, результат около нуля Задача: Нужно содрать данные с одного сайт, данные эти обновляются каждую секунду например https://www.boerse-frankfurt.de/index/dax котировка индекса DAX в середине страницы справа от графика текст страницы получаю через requests.get(url) беда в том что обновляемые данные не попадают, похоже не успевают запустить скрипты как получить эти данные, дайте пару советов через браузер они скачиваются нормально, сейчас изучаю селениум, я так понял что она мне может помочь, но каждый раз будет открываться браузер, это очень долго и затратно. я новичок, только познаю питон, поэтому сильно не ругайте Спасибо всем кто откликнулся.
0
|
|
| 29.08.2022, 12:35 | |
|
Ответы с готовыми решениями:
12
Шаблон с динамическими данными из MSSQL |
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
|
| 29.08.2022, 19:52 [ТС] | |
|
В общем решил что буду пробовать через selenium и PhantomJS
но столкнулся с проблемой код вот такой from selenium import webdriver написал самой первой строчкой в коде driver = webdriver.PhantomJS() Ошибка вот такая driver = webdriver.PhantomJS() AttributeError: module 'selenium.webdriver' has no attribute 'PhantomJS' в списке есть хромы, ие и прочие, phantomjs нету selenium и PhantomJS устанавливал pip install selenium pip install phantomjs что я не доустановил? хелп плиз
0
|
|
|
148 / 111 / 37
Регистрация: 28.11.2013
Сообщений: 383
|
||||||
| 30.08.2022, 19:11 | ||||||
|
Можно попробовать requests_html для обработки js скриптов, но не всегда работает. Но render страницы будет долгим как в селениуме. Что касается ваших данных, то у меня получилось так:
Кликните здесь для просмотра всего текста
Добавлено через 7 минут У меня requestами не всё удалось найти, догадываюсь, что часть данных вычисляется скриптами, а не посылается с сервера.
1
|
||||||
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
||||||
| 30.08.2022, 21:43 [ТС] | ||||||
|
Спасибо что откликнулся на мою проблему, но видимо я не корректно объяснил свою задачу
Исходя из вашего когда я понял что код формирует запрос к API и уже апи формирует таблицу мне же нужно именно спарсить страницу и извлечь из нее данные, они формируются без api [attach]https://www.cyberforum.ru/attachment.php?attachmentid=1365250&stc= 1&d=1661884287[/attach] я попробовал через render, но у меня ошибка и не могу с ней справиться
как все таки через рендер попробовать?
0
|
||||||
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
|
| 05.09.2022, 00:04 [ТС] | |
|
А какие еще варианты спарсить сайт с JS есть?
Seleniumу не все серваки доступ дают
0
|
|
|
87 / 95 / 15
Регистрация: 26.06.2013
Сообщений: 4,755
|
||
| 08.09.2022, 17:30 | ||
|
Добавлено через 56 секунд Имею в виду, если использовать fake модули.
0
|
||
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
|
| 08.09.2022, 22:23 [ТС] | |
|
supmener, не знаю, предположил просто
0
|
|
|
14314 / 9400 / 1355
Регистрация: 21.01.2016
Сообщений: 35,450
|
||
| 09.09.2022, 03:34 | ||
|
0
|
||
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
|
| 09.09.2022, 19:08 [ТС] | |
|
Usaga, через селениум в хроме открывал один сайт - так он ругнулся и спарсилась только сообщение эксесс денайд
исходя из это го предположил что как то отслеживают через что доступ
0
|
|
|
14314 / 9400 / 1355
Регистрация: 21.01.2016
Сообщений: 35,450
|
|
| 10.09.2022, 03:44 | |
|
bzda, предположение ошибочное.
0
|
|
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
||
| 24.01.2023, 21:32 [ТС] | ||
|
Я в хроме в дев консоли смотрел запросы, ничего подобного не нашел Или где и что почитать для изучения данной проблемы?
0
|
||
|
148 / 111 / 37
Регистрация: 28.11.2013
Сообщений: 383
|
|
| 26.01.2023, 00:22 | |
|
Какой конкретно запрос я отловил тогда, я уже не помню, но алгоритм действий такой:
1) копируем данные запроса как curl 2) Гуглим :"curl to python" 3) Вставляем код и копируем python со всеми запросами, нажав на кнопку "copy to clipboard".
1
|
|
|
8 / 6 / 2
Регистрация: 29.08.2022
Сообщений: 54
|
|
| 26.01.2023, 13:26 [ТС] | |
|
блин, я думал как то в автомате это можно сделать, а тут получается нужно нужно выбрать из кучи запросов нужный и его уже колупать, да еще нужный запрос происходит с задержкой
вообще у меня был план такой через селениум заходим на по ссылке, от селениума получаем лог с запросом далее его сохраняем потом уже делаем запрос и изучаем данные которые пришли по нему
0
|
|
| 26.01.2023, 13:26 | |
|
Помогаю со студенческими работами здесь
13
Как сравнить таблицы с динамическими данными Создание кастомного календаря с динамическими данными Обмен данными между двумя динамическими массивами Работа с динамическими данными. Исключение элементов из списка. Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Контроль заполнения и очистка дат в зависимости от значения перечислений
Maks 12.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2.
Задача: реализовать контроль корректности заполнения дат назначения. . .
|
Архитектура слоя интернета для сервера-слоя.
Hrethgir 11.04.2026
В продолжение https:/ / www. cyberforum. ru/ blogs/ 223907/ 10860. html
Знаешь что я подумал? Раз мы все источники пишем в голове ветки, то ничего не мешает добавить в голову такой источник, который сам. . .
|
Подстановка значения реквизита справочника в табличную часть документа
Maks 10.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2.
Задача: при выборе сотрудника (справочник Сотрудники) в ТЧ документа. . .
|
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях.
Задача: при копировании документа очищать определенные реквизиты и табличную. . .
|
|
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git
main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели
8ATzM_2aurI
|
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2.
Задача: запретить редактирование документа, если он открыт у другого пользователя.
/ / . . .
|
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои.
А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
|
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20%
kYBz3eJf3jQ
|