Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.63/8: Рейтинг темы: голосов - 8, средняя оценка - 4.63
-18 / 1 / 0
Регистрация: 28.08.2022
Сообщений: 138

Почему мой парсер возвращает None?

10.02.2023, 10:31. Показов 1904. Ответов 4
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Написал парсер:
Python
1
2
3
4
5
6
7
print(url)
URL = "https://www.kinopoisk.ru"+url
print(URL)
r2 = requests.get(URL)
html2 = BS(r2.content, 'lxml')
s2 = html2.body.find('p',class_='styles_paragraph__wEGPz')
about = s2.text
Не работает конкретно этот кусок. В теории он должен доставать мне содержимое тега <p> с классом styles_paragraph__wEGPz
Но он этого не далает... При чем перемнная url корректна, я проверял, ссылка на страницу, которую парсит код абсолютно корректна, ведет именно туда, откуда я и пытаюсь взять тег <p>. html:
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
10.02.2023, 10:31
Ответы с готовыми решениями:

Почему мой парсер не работает на Linix Ubuntu 3.x?
У меня есть парсер. На windows 11 он работает абсолютно корректно, возвращает именно то, что нужно: ] import requests from bs4 import...

Почему мой парсер работает на Windows но не работает на Linux?
У меня есть парсер. На windows 11 он работает абсолютно корректно, возвращает именно то, что нужно: import requests from bs4 import...

Мой первый парсер
Начал делать парсер на php, сделал то, что он парсит, что надо, но появилась сложность. Не могли бы вы помочь, пожалуйста, уже 2 часа...

4
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7391 / 4818 / 1246
Регистрация: 30.03.2015
Сообщений: 13,687
Записей в блоге: 29
10.02.2023, 10:41
Цитата Сообщение от ctepler Посмотреть сообщение
Но он этого не далает...
значит его там нет, например генерится автоматически, что подтверждает случайный набор символов в локаторе

Цитата Сообщение от ctepler Посмотреть сообщение
При чем перемнная url корректна
а что же ты тогда не приложил вывод своей программы, чтобы посмотреть на все принты?
0
-18 / 1 / 0
Регистрация: 28.08.2022
Сообщений: 138
10.02.2023, 11:55  [ТС]
Она не генерируется случайно. Сколько раз обновлялс траницу, смотрел с дургих бразуеров, имя классе не меняется.
Ссылка корректна, так если перейти по ней, то тебя бросает на сайт с фильмом, название которого было введено. Но если вас так это волнует, вот код:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
import requests
from bs4 import BeautifulSoup as BS
 
def GetLink(FilmName):
    FM = FilmName.replace(" ", "+")
    r = requests.get(f'https://www.kinopoisk.ru/index.php?kp_query={FM}')
    html = BS(r.content, 'lxml')
    s = html.body.find('div',class_='info')
    a = s.find('a')
    rat = html.body.find('div', class_='rating')
    url = a.attrs["data-url"]
    res = html.find("p", class_="name")
    
    print(url)
    URL = "https://www.kinopoisk.ru"+url
    print(URL)
    r2 = requests.get(URL)
    html2 = BS(r2.content, 'lxml')
    s2 = html2.body.find('p',class_='styles_paragraph__wEGPz')
    about = s2.text
    
    print[url, rat.text, res.text, about]
    return[url, rat.text, res.text, about]
0
Модератор
Эксперт Python
 Аватар для Fudthhh
2695 / 1601 / 513
Регистрация: 21.02.2017
Сообщений: 4,210
Записей в блоге: 1
10.02.2023, 12:48
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
import requests
import lxml.html
import typing
 
search: str = "Мальчишник"
 
url: str = "https://www.kinopoisk.ru/index.php"
params: typing.Dict[str, typing.Any] = {"kp_query": search}
repsonse: requests.Response = requests.get(url, params)
print(repsonse.status_code)
 
html: lxml.html.HtmlElement = lxml.html.fromstring(repsonse.content)
 
elements: typing.List[lxml.html.HtmlElement] = html.find_class("element")
for element in elements:
    names: typing.List[lxml.html.HtmlElement] = element.find_class("name")
    if names:
        print("Name:", names[0].text_content())
 
    ratings: typing.List[lxml.html.HtmlElement] = element.find_class("rating")
    if ratings:
        print("Rating:", ratings[0].text_content())
0
 Аватар для TimutGin
515 / 339 / 146
Регистрация: 16.02.2021
Сообщений: 626
10.02.2023, 13:15
ctepler, проблема в том что в ответ на
Цитата Сообщение от ctepler Посмотреть сообщение
html2 = BS(r2.content, 'lxml')
приходит не страница фильма, а капча от сайта
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
10.02.2023, 13:15
Помогаю со студенческими работами здесь

парсер который возвращает json ВАЖНО!
Доброго времени суток. Скрипт &lt;? $request = &quot;GET...

POST-запрос возвращает не то, пишу парсер
Здравствуйте, проблема такова: Пишу парсер одного сайта, там данные подгружаются динамически при нажатии на кнопку &quot;Показать...

Сделать парсер который читает чужую страницу возвращает массив значений
Нужно взять данные с сайта https://www.leon.ru/events/prematch/1424967069597697/1424967075212442 Скрипт должен возвращать массив с...

Парсер. Yandex как-то определяет, что запрос от скрипта, и возвращает капчу.
$proxyYandex = Proxy::model()-&gt;getRandProxyYandex(); $unQuery = 'site:vk.com' ; $predFiltrLink =...

Почему не работает парсер?
Сообщения приходят на почту с bb кодами. Т.е.так: текст Html: &lt;!doctype html&gt; &lt;html&gt; &lt;head&gt; &lt;meta charset=&quot;utf-8&quot;...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
Символьное дифференцирование
igorrr37 13.02.2026
/ * Логарифм записывается как: (x-2)log(x^2+2) - означает логарифм (x^2+2) по основанию (x-2). Унарный минус обозначается как ! в-строка - входное арифметическое выражение в инфиксной(обычной). . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru