Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/6: Рейтинг темы: голосов - 6, средняя оценка - 5.00
0 / 0 / 0
Регистрация: 17.02.2017
Сообщений: 4

Проблема с парсингом

27.07.2019, 15:18. Показов 1319. Ответов 7
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый день.

Пытаюсь спарсить архив тендеров.
https://www.nornickel.ru/suppl... ?archive=Y

Вот фрагмент кода:
Python
1
2
3
4
5
6
7
8
9
10
11
url='https://www.nornickel.ru/suppliers/tenders/central/?archive=Y'
 
html=requests.get(url).text
 
soup=BeautifulSoup(html,'lxml')
p=soup.find('div',class_='tenders-container--local')
p1=p.find('div',class_='data-table-scroll')
 
 
print(type(p))
print(type(p1))
type(p) - <class 'bs4.element.Tag'>
а дальше beautifulsoup не видит
type(p1) - <class 'NoneType'>

Помогите понять причину.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
27.07.2019, 15:18
Ответы с готовыми решениями:

Проблема с парсингом
Делаю парсинг сайта для себя. Вот часть функции: for item in cards: cards_name = item.find(&quot;div&quot;,...

Проблема с парсингом Бинг
Доброго времени суток. Недавно начал изучать Пайтон. В качестве практики решил написать простой парсер выдачи Bing. Но столкнулся с...

Проблема с парсингом
Помогите пожалуйста, первый раз пытаюсь парсить, и при выводе &quot;a&quot; выводится как будто 2 списка, сама переменная &quot;a&quot; является...

7
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
27.07.2019, 20:17
Цитата Сообщение от Zod1ak Посмотреть сообщение
'data-table-scroll'
Там нет элемента с таким классом.
0
0 / 0 / 0
Регистрация: 17.02.2017
Сообщений: 4
28.07.2019, 12:41  [ТС]
Прилагаю скрин кода
Вложения
Тип файла: zip Скрин.zip (139.0 Кб, 4 просмотров)
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
28.07.2019, 14:14
Цитата Сообщение от Zod1ak Посмотреть сообщение
Прилагаю скрин кода
Ну и что? Его все равно там нет.
Учите матчасть. Откройте теперь исходный код страницы Ctrl+U и найдите там этот div.
Нет его там. Потому что он динамический. Поэтому вы его никогда не найдете в том html коде, который вам прислал сервер.
1
0 / 0 / 0
Регистрация: 17.02.2017
Сообщений: 4
31.07.2019, 18:38  [ТС]
Друже.
Если сможите объяснить как получить данные с таблицы, буду очень благодарен.
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
31.07.2019, 22:22
Если бы внимательно посмотрели на div
HTML5
1
<div class="table table--tenders" id="tenders-table-centralized" data-ajax-path="/ajax/tenders-centralized.php"
то увидели бы, что здесь выполняется AJAX запрос php скрипта.

Результат возвращается в виде json содержащего все таблицу с ее html кодом.


POST запрос сложный, поэтому рассказывать как его выполнить я не буду.
Тем, кто пользуется "прекрасным супом" для парсинга, обычно это бесполезно.
1
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
31.07.2019, 22:34
P.S. В качестве подсказки: более простым (для неподготовленного кодера) будет использование selenium в связке с headless браузером, который отрендерит всю динамику и можно будет парсить html старым дедовским способом.
0
0 / 0 / 0
Регистрация: 17.02.2017
Сообщений: 4
01.09.2019, 18:14  [ТС]
Спасибо, с помощью Selenium проблемы просто не стало
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
01.09.2019, 18:14
Помогаю со студенческими работами здесь

Проблема с парсингом сайта
Всем доброго времени суток, может кто помочь решить проблему с выводом данных, а именно меняя страницу ссылки (steam_link с помощью цикла...

Проблема с парсингом текста из docx файла
я не могу разобраться как парсить абсолютно весь текст с docx файла тот способ где везде описывается не парсит ничего кроме просто...

Парсинг BeautiulSoup. Проблема с с парсингом ссылок страниц
Суть в следующем. Пытался спарсить ссылки страниц результатов матча. Теги (a) читаются, а когда добавляю class_='rtxz9t-2 a6bwd9-5 kBrRDJ'...

Проблема с парсингом сайта при работе на хостинге
Всем привет! Столкнулся с такой проблемой: написал парсер сайта который отлично работает у меня на компьютере, но когда я запускаю его на...

Проблема с парсингом
Скрипт работает, я вижу парсинг в терминале Но не вижу результаты парсинга в папке 123 проекта Почему? from icrawler.builtin...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
Новые блоги и статьи
Программный контроль заполнения реквизита табличной части документа
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: реализовать контроль заполнения реквизита "ПричинаСписания". . .
wmic не является внутренней или внешней командой
Maks 02.04.2026
Решение: DISM / Online / Add-Capability / CapabilityName:WMIC~~~~ Отсюда: https:/ / winitpro. ru/ index. php/ 2025/ 02/ 14/ komanda-wmic-ne-naydena/
Программная установка даты и запрет ее изменения
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: при создании документов установить период списания автоматически. . .
Вывод данных в справочнике через динамический список
Maks 01.04.2026
Реализация из решения ниже выполнена на примере нетипового справочника "Спецтехника" разработанного в конфигурации КА2. Задача: вывести данные из ТЧ нетипового документа. . .
Программное заполнения текстового поля в реквизите формы документа
Maks 01.04.2026
Алгоритм из решения ниже реализован на нетиповом документе "ВыдачаОборудованияНаСпецтехнику" разработанного в конфигурации КА2, в дополнении к предыдущему решению. На форме документа создается. . .
К слову об оптимизации
kumehtar 01.04.2026
Вспоминаю начало 2000-х, университет, когда я писал на Delphi. Тогда среди программистов на форумах активно обсуждали аккуратную работу с памятью: нужно было следить за переменными, вовремя. . .
Идея фильтра интернета (сервер = слой+фильтр).
Hrethgir 31.03.2026
Суть идеи заключается в том, чтобы запустить свой сервер, о чём я если честно мечтал давно и давно приобрёл книгу как это сделать. Но не было причин его запускать. Очумелые учёные напечатали на. . .
Модель здравосоХранения 6. ESG-повестка и устойчивое развитие; углублённый анализ кадрового бренда
anaschu 31.03.2026
В прикрепленном документе раздумья о том, как можно поменять модель в будущем
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru