Форум программистов, компьютерный форум, киберфорум
Python: Django
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.75/8: Рейтинг темы: голосов - 8, средняя оценка - 4.75
0 / 0 / 0
Регистрация: 05.12.2019
Сообщений: 10

Как убрать soup = BeautifulSoup (html) из кода?

22.12.2020, 16:41. Показов 1746. Ответов 4
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Приветствую всех, только недавно начал изучать Python, дали задание: сделать парс расписания нашей группы в универе. Пользовался Beautiful Soup, пока только ввёл заголовок, убрал HTML теги. Но на выходе всё равно выводится какая-то гадость. Подскажите, как её убрать, пожалуйста) Прилагаю код и картинку командной строки:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
from datetime import datetime, date, time
import urllib.request
from bs4 import BeautifulSoup
def site(url):
    response = urllib.request.urlopen(url)
    return response.read()
 
def parse(html):
    soup = BeautifulSoup (html)
    data = soup.find('div', class_='wrap wrap__name_main-content')
    dataa = data.find_all('h1', class_='page-title')
    dataaa = dataa[0].text.strip()
    soup.body.decompose()
    print(dataaa)
 
def main():
    parse(site(' https://www.sgu.ru/schedule/mm/do/242' ))
 
 
if __name__ == '__main__':
      main()
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
22.12.2020, 16:41
Ответы с готовыми решениями:

Как убрать H1 заголовок страницы из HTML кода?
Доброго дня. Подскажите, пожалуйста, как можно убрать H1 заголовок страницы из HTML кода? Чтобы он не выводился автоматически. Есть...

Как убрать знаки переноса строки из html кода
У меня есть код: import urllib.request html = urllib.request.urlopen('http://адрес/').read() В переменной html кроме нужно для...

Как вытащить значения из таблицы HTML используя BeautifulSoup
Здравствуйте! Я пытаюсь вытащить все значения из таблице, которые находятся в левой колонке с помощью beautifulSoup. Они находятся в теге...

4
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
22.12.2020, 16:47
Забудь про BeautifulSoup и используй lxml.
0
0 / 0 / 0
Регистрация: 05.12.2019
Сообщений: 10
22.12.2020, 17:04  [ТС]
А как его использовать?

Добавлено через 17 секунд
а как его использовать?
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
22.12.2020, 23:05
Цитата Сообщение от den102ars Посмотреть сообщение
а как его использовать?
Точно также. Но с умом. И чтобы в следующий раз не задавать такие наивные вопросы - начинать с чтения документации.
0
60 / 44 / 18
Регистрация: 05.03.2019
Сообщений: 313
23.12.2020, 03:49
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
from datetime import datetime, date, time
import urllib.request
from bs4 import BeautifulSoup
 
 
def strip_text_if_exists(element: BeautifulSoup):
    if element:
        return element.text.strip()
 
 
def site(url):
    response = urllib.request.urlopen(url)
    return response.read()
 
def parse(html):
    soup = BeautifulSoup(html, 'lxml')
    data = soup.find('div', class_='wrap wrap__name_main-content')
    dataa = data.find_all('h1', class_='page-title')
    dataaa = strip_text_if_exists(dataa[0])
    soup.body.decompose()
    print(dataaa)
 
def main():
    parse(site(' https://www.sgu.ru/schedule/mm/do/242' ))
 
 
if __name__ == '__main__':
      main()
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
23.12.2020, 03:49
Помогаю со студенческими работами здесь

Как вытащить текст из данного HTML с помощью Beautifulsoup
Всем добрый вечер! Не могу понять как вытащить значение True из данного HTML с помощью Beautifulsoup, если можно, то без использования...

Beautiful Soup 4, сравнение html-парсеров при запуске в потоке
Здравствуйте, спарсил страницу с помощью lxml, встроенного в Beautiful Soup - выдал 30 секунд. Не поверил, начал искать ошибки и...

Убрать все html-теги из кода
есть код и мне нужно убрать все html теги например: он выводит это <td>30</td> <td><a...

Парсинг, beautifulsoup, некорректная HTML разметка
Доброго времени суток! Изучаю парсинг сайтов. Beautifulsoup, lxml. Столкнулся с такой проблемой: при обращении к странице получаю...

Не удается открыть локальный html файл в beautifulsoup
Пишу так with open(main_last_addr+'.html', 'w+') as out2: print(out2) В ответ получаю <_io.TextIOWrapper...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
моя боль
iceja 24.01.2026
Выложила интерполяцию кубическими сплайнами www. iceja. net REST сервисы временно не работают, только через Web. Написала за 56 рабочих часов этот сайт с нуля. При помощи perplexity. ai PRO , при. . .
Модель сукцессии микоризы
anaschu 24.01.2026
Решили писать научную статью с неким РОманом
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь(не выше 3-го порядка) постоянного тока с элементами R, L, C, k(ключ), U, E, J. Программа находит переходные токи и напряжения на элементах схемы классическим методом(1 и 2 з-ны. . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru