Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.55/11: Рейтинг темы: голосов - 11, средняя оценка - 4.55
0 / 0 / 0
Регистрация: 24.10.2015
Сообщений: 142

При парсинге не находится тэг

10.05.2022, 09:27. Показов 2166. Ответов 4

Студворк — интернет-сервис помощи студентам
Всем привет.

Изучаю парсинг с помощью BeautifulSoup.

Написал такой код:
Python
1
2
3
4
5
6
7
8
9
10
import requests
from bs4 import BeautifulSoup
 
with open(r"C:\777\Scraping\test_1.txt") as f:
    quotes = f.read()
f.close()
 
soup = BeautifulSoup(quotes, "lxml")
quotes1 = soup.find('div', class_='fusion-text fusion-text-3')
print(quotes1)
Тэги body, html находит, а <div class="fusion-text fusion-text-3" style="text-transform:none;"> не видит.
Подскажите, pls, что я не так написал, и как написать, чтобы работало.
Файл для парсинга - во вложении (исключительно для примера).

Благодарю.
Вложения
Тип файла: txt test_1.txt (958 байт, 8 просмотров)
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
10.05.2022, 09:27
Ответы с готовыми решениями:

Установить href в тэг A, который находится внутри div
Скажите пожалуйста, есть у меня вот такая структура &lt;div id=&quot;nav_b1&quot; class=&quot;pr disf fdr fjcc faic w20p h100p f3 tcw curspoi...

Вывести в return не только тэг li, но и ссылку тэг <a> внутри него
Всем привет, вообщем взялся я крестить два плагина и почти у меня это получилось, прошу вашей помощи, т.к. собственных знаний не достает....

Как добавить name в тэг <H1> (ну или в другой подобный тэг)
Битый час пытаюсь, но ничего не выходит((((! protected void Page_Load(object sender, EventArgs e) { string name =...

4
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
10.05.2022, 11:31
Python
1
soup = BeautifulSoup(quotes, "html.parser")
0
0 / 0 / 0
Регистрация: 24.10.2015
Сообщений: 142
10.05.2022, 11:41  [ТС]
К сожалению ничего не изменилось.
0
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
10.05.2022, 11:43
Лучший ответ Сообщение было отмечено MaxGal как решение

Решение

Ну, наверно я лютый колдун
1
0 / 0 / 0
Регистрация: 24.10.2015
Сообщений: 142
10.05.2022, 12:17  [ТС]
Проблема была в том, что у меня не был указан encode='utf-8'.
Благодарю!
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
10.05.2022, 12:17
Помогаю со студенческими работами здесь

Появляются лишние символы при сохранении страниц html при парсинге с Селениум
В коде такой фрагмент. С проблемой сталкивался на разных сайтах. На заднем плане скриншот из браузера. На переднем из текстового редактора...

Проблемы при парсинге статьи. Удаляются некоторые данные при сохранении полученной страницы
Здравствуйте. Наткнулся на интересную защиту от парсинга. Получаю страницу с помощью WebBrowser или CefSharp. Таким образом JS...

Как при поиске в XML пропустить тэг
Всем привет. Есть xml документ, вот его часть: &lt;ZAP&gt; &lt;ID_PAC&gt;30202&lt;/ID_PAC&gt; &lt;NOVOR&gt;1&lt;/NOVOR&gt; ...

При открытии простейшей страници ругается на тэг <%
Поставил IIS нарисовал простенькую страницу протестировать что и как, с ходу выдает такую ошибку: Ошибка синтаксического анализа XML:...

Ошибка при парсинге IP
Какая-то странная ошибка возникает при парсинге строки Ip. Сама строка берётся из MaskedTextBox. Адрес 127.000.000.001 парсится нормально,...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
моя боль
iceja 24.01.2026
Выложила интерполяцию кубическими сплайнами www. iceja. net REST сервисы временно не работают, только через Web. Написала за 56 рабочих часов этот сайт с нуля. При помощи perplexity. ai PRO , при. . .
Модель сукцессии микоризы
anaschu 24.01.2026
Решили писать научную статью с неким РОманом
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь(не выше 3-го порядка) постоянного тока с элементами R, L, C, k(ключ), U, E, J. Программа находит переходные токи и напряжения на элементах схемы классическим методом(1 и 2 з-ны. . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru