Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/8: Рейтинг темы: голосов - 8, средняя оценка - 5.00
1 / 1 / 0
Регистрация: 29.04.2018
Сообщений: 26

Парсинг страницы

11.05.2020, 17:04. Показов 1827. Ответов 6
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый вечер) Может кто подсказать. Я пытаюсь вытащить из страницы вот этот тег:
HTML5
1
<dd class="ng-star-inserted">680</dd>
На странице я смотрю код, этот тег там есть, но когда я пытаюсь вытащить его, программа выдает "None". Я попробовала проверить, а что видит программа (какие теги страницы). Получилось так, что этот тег программа не видит.
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
with req.Session() as s:
    url = 'https://e.lanbook.com/api/v2/signin'
 
    datas = { 
    "login":"****",
    "password":"****",
    "type":"UserCredentials"
        }
    
    s.get(url)
    y = s.post(url, data = datas)   
    url2 = "https://e.lanbook.com/book/135669"
    resp = s.get(url2)
    soup = BeautifulSoup(resp.text, 'lxml')
   #пытаюсь вытащить из страницы тег   --> None 
    print(soup.find("dd", {"class":"ng-star-inserted"})) 
    #пытаюсь вытащить все теги
    print(soup)
Во вложении я показала, где должен быть мой тег. Но получается, что программа даже не видит, что содержится между этими тегами. Можно ли это как то исправить? Ведь если я захожу на сайт и проверяю код страницы, то там отображается тот тег. На втором и третьем рисунке я показала кусочек кода страницы. Помогите, пожалуйста, решить данную проблему, если это возможно)
Миниатюры
Парсинг страницы   Парсинг страницы   Парсинг страницы  

0
Лучшие ответы (1)
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
11.05.2020, 17:04
Ответы с готовыми решениями:

Парсинг страницы
Здравствуйте! Есть проблема с получением информации с сайта. Отрывок кода страницы: &lt;div class='lesson lesson-lecture'...

Парсинг html страницы
Здравствуйте. Есть видео где мужик парсит html страницу и далее заносит все ссылки которые нашёл:...

Парсинг json страницы
Доброй ночи. Есть json страница. Как её прочитать не скачивая и вывести оттуда значение ключа metar, то есть &quot;2022-03-08...

6
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,664
Записей в блоге: 29
11.05.2020, 17:10
Лучший ответ Сообщение было отмечено Welemir1 как решение

Решение

Моргарита, и имя не можешь без ошибки написать и парсингом занялась не понимая что делаешь. Не нужна тебе веб страница, кидай запрос на https://e.lanbook.com/api/v2/catalog/book/135669 и там все в жсоне красивом есть
Python
1
2
3
>>> resp = requests.get('https://e.lanbook.com/api/v2/catalog/book/135669')
>>> resp.json()['body']['pages']
680
1
1 / 1 / 0
Регистрация: 29.04.2018
Сообщений: 26
11.05.2020, 17:20  [ТС]
Имя я специально так написала, если вам глаза режет, можете не смотреть на имя) А ссылку я кинула такую, потому что в программе предполагается, что все будут загружать файл с такими ссылками, а не искать ссылки такого вида https://e.lanbook.com/api/v2/catalog/book/135669. Поэтому и нужна помощь именно вот с этим(((
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,664
Записей в блоге: 29
11.05.2020, 17:24
Моргарита, а в чем сложность преобразовать
https://e.lanbook.com/book/135669 в https://e.lanbook.com/api/v2/catalog/book/135669
закономерность не видите?

Не, если конечно хочется долго и мучительно, то используй селениум, и там парсь страницу, реквест не сможет, ибо джаваскриптом все подгружается.
0
1 / 1 / 0
Регистрация: 29.04.2018
Сообщений: 26
11.05.2020, 17:39  [ТС]
Я вижу закономерность, думаю, смогу разделить и склеить ссылку) Но мне нужно сказать еще сколько страниц доступно. Вот, например, в той ссылке сказано, что страниц 680, но на самом деле, доступно только 10. А вот в этой ссылке https://e.lanbook.com/book/38399 страниц 169, и они все доступны. Я хотела вытащить параметр, где написано, что чтение книги недоступно, это значит, что в книге от силы страниц 10-15.
Миниатюры
Парсинг страницы  
0
1 / 1 / 0
Регистрация: 29.04.2018
Сообщений: 26
11.05.2020, 17:43  [ТС]
Оооо, там есть параметр available. Я по нему и буду ориентироваться. Спасибо)
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,664
Записей в блоге: 29
11.05.2020, 17:49
Моргарита, БИНГО! там в жсоне есть все
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
11.05.2020, 17:49
Помогаю со студенческими работами здесь

Парсинг html страницы не работает
https://www.youtube.com/watch?v=MaWm1VpWj1A&amp;list=LLiAY9i8Qha2Vx2j21Jk88PA&amp;index=2&amp;t=696s в этом видео парень рассказывает как спарсить...

Делаю парсинг страницы, работаю с апи, и отдает не весь текст, почему так
Делаю парсинг страницы, работаю с апи, и отдает не весь текст, почему так? Заранее спасибо import json import requests myURL...

Парсинг страницы
Здравствуйте,требуется написать программу на языке Python , которая парсит с сайта &quot;Викисловарь&quot; значение любого слова.

Парсинг страницы
Здравствуйте! Столкнулся с такой проблемой, что не могу спарсить страницу. Я использовал BeautifulSoup для парсинга, но суть проблемы в...

Парсинг страницы
from urllib.request import urlopen from bs4 import BeautifulSoup import re def get_links(url): html = urlopen(url) ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
7
Ответ Создать тему
Новые блоги и статьи
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
Фото: Daniel Greenwood
kumehtar 13.11.2025
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru