Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
 
Рейтинг 4.53/15: Рейтинг темы: голосов - 15, средняя оценка - 4.53
 Аватар для supmener
87 / 95 / 15
Регистрация: 26.06.2013
Сообщений: 4,753

Как работать с BeautifulSoup?

17.08.2022, 12:47. Показов 3661. Ответов 29
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Не могу понять эту конструкцию.
Python
1
print(soup.html.nextSibling == None) # True
Полный код:
Python
1
2
3
4
5
6
7
doc = ['<html><head><title>Page title</title></head>',
       '<body><p id="firstpara" align="center">This is paragraph <b>one</b>.',
       '<p id="secondpara" align="blah">This is paragraph <b>two</b>.',
       '</html>']
soup = BeautifulSoup(''.join(doc))
print(soup.html.nextSibling == None) # True
# Источник http://wiki.python.su/Документации/BeautifulSoup
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
17.08.2022, 12:47
Ответы с готовыми решениями:

Как решить проблему с установкой BeautifulSoup
привет всем подскажите как решить проблему с установкой BeautifulSoup выскакивает вот такая ошибка при установке через pip и через...

Как искать следующий элемент в BeautifulSoup
Спарсил страницу в ней таблица &lt;tbody _ngcontent-boerse-frankfurt-c136=&quot;&quot;&gt; &lt;tr _ngcontent-boerse-frankfurt-c136=&quot;&quot;...

Как используя BeautifulSoup и requests чтобы считать надпись на кнопке ?
Как на питон реализовать считывание надписи на кнопке и вывести ее в консоль Вот сам класс на html &lt;div...

29
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,667
Записей в блоге: 29
01.01.2023, 23:00
Студворк — интернет-сервис помощи студентам
Цитата Сообщение от supmener Посмотреть сообщение
Слово unicode подчеркивает ошибкой
а ты еще более старый туториал найди, нет случайно еще древнее 2 питона?)))

ты мне одно объясни - если тебе не лень по подворотням и мутным источникам лазить, то почему сайт питона не открыть и в поиске не ввести например тот же уникод и там прочесть? и поступать так с каждым вопросом и ошибкой?
Удиви нас в новый год -прочти хоть одну книгу по питону и начни пользоваться документацией, вот она https://docs.python.org/3/index.html
2
07.01.2023, 20:11

Не по теме:

Цитата Сообщение от Welemir1 Посмотреть сообщение
то почему сайт питона не открыть и в поиске не ввести например тот же уникод и там прочесть? и поступать так с каждым вопросом и ошибкой?
Мне кажется, что причина тут та же, что и у глубокоуважаемого мистера Etyuhibosecyu: высокая когнитивная нагрузка на мозг, создаваемая чтением технической литературы, мгновенно вызывает перегрев и реакцию защитной системы. А именно - переключение внимания на что-то другое. Что и видим. Задумал что-то, начал разбираться, перегрелся - бац! - новый вопрос по совсем другой теме. Только у Etyuhibosecyu не настолько плохо.

Вот и ходят эти два чувака кругами по залу с дверьми, долбясь в каждую лбом поочерёдно, не способные открыть...

0
 Аватар для supmener
87 / 95 / 15
Регистрация: 26.06.2013
Сообщений: 4,753
07.01.2023, 22:53  [ТС]
Уже треть этого туториала изучил, используя третий Питон.
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,667
Записей в блоге: 29
08.01.2023, 09:11
supmener, а как дела с докой или хоть с какой то книгой? Будут нам сюрпризы на Новый Год?
1
 Аватар для supmener
87 / 95 / 15
Регистрация: 26.06.2013
Сообщений: 4,753
08.01.2023, 20:10  [ТС]
Изучаю сейчас только это по поводу парсинга на BS. Это не так просто, потому что туториал большой.

Добавлено через 5 часов 19 минут
Нашел то, что похоже, что не работает, как в примере.
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
from bs4 import BeautifulSoup
html_doc = """
<html><head><title>The Dormouse's story</title></head>
<body>
<p class="title"><b>The Dormouse's story</b></p>
<b>The Dormouse's story 2</b>
 
<p class="story">Once upon a time there were three little sisters; and their names were
<a href="http://example.com/elsie" class="sister" id="link1">Elsie</a>,
<a href="http://example.com/lacie" class="sister" id="link2">Lacie</a> and
<a href="http://example.com/tillie" class="sister" id="link3">Tillie</a>;
and they lived at the bottom of a well.</p>
 
<p class="story">...</p>
"""
 
soup = BeautifulSoup (html_doc, 'html.parser')
 
"""
Если ничто из перечисленного вам не подходит, определите функцию, 
которая принимает элемент в качестве единственного аргумента. Функция должна вернуть True, 
если аргумент подходит, и False, если нет.
Вот функция, которая возвращает True, если в теге определен атрибут “class”, но не определен атрибут “id”:
"""
"""
Не работает похоже по описанию:
Эта функция выбирает только теги <p>. Она не выбирает теги <a>, поскольку в них определены и атрибут “class” , 
и атрибут “id”. 
Она не выбирает теги вроде <html> и <title>, потому что в них не определен атрибут “class”.
"""
 
def has_class_but_no_id(tag):
    return tag.has_attr('class') and not tag.has_attr('id')
# Передайте эту функцию в find_all(), и вы получите все теги <p>:
print(soup.find_all(has_class_but_no_id))
"""
Вывело:
[<p class="title"><b>The Dormouse's story</b></p>, <p class="story">Once upon a time there were three little sisters; 
and their names were
<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,
<a class="sister" href="http://example.com/lacie" id="link2">Lacie</a> and
<a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>;
and they lived at the bottom of a well.</p>, <p class="story">...</p>]
"""
0
 Аватар для supmener
87 / 95 / 15
Регистрация: 26.06.2013
Сообщений: 4,753
09.01.2023, 11:24  [ТС]
Ссылка на не переведенный фрагмент документации https://www.crummy.com/softwar... a-function

Добавлено через 14 минут
Цитата Сообщение от Welemir1 Посмотреть сообщение
а как дела с докой или хоть с какой то книгой?
Это перевод официальной документации Bs4.
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,667
Записей в блоге: 29
09.01.2023, 13:56
supmener, перевод? а ты чего не пошел учить 1С, там все на русском?
0
 Аватар для supmener
87 / 95 / 15
Регистрация: 26.06.2013
Сообщений: 4,753
09.01.2023, 14:01  [ТС]
Тоже нормальная тема.
0
10.01.2023, 10:05

Не по теме:

Цитата Сообщение от Welemir1 Посмотреть сообщение
а ты чего не пошел учить 1С, там все на русском?
Так там РАБОТАТЬ надо :)

0
 Аватар для supmener
87 / 95 / 15
Регистрация: 26.06.2013
Сообщений: 4,753
13.03.2023, 06:05  [ТС]
Есть несколько версий похожей документации.
Здесь https://www.crummy.com/softwar... bs4ru.html нет разделов:
Обработка дублирующих атрибутов
Создание пользовательских подклассов
Настройка многозначных атрибутов
А здесь есть:
http://bs4ru.geekwriter.ru/bs4ru.html
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
13.03.2023, 06:05
Помогаю со студенческими работами здесь

Как убрать soup = BeautifulSoup (html) из кода?
Приветствую всех, только недавно начал изучать Python, дали задание: сделать парс расписания нашей группы в универе. Пользовался Beautiful...

Как выделить текст из тега через BeautifulSoup?
Написал такой скрипт: #!/usr/bin/env python # -*- coding: utf-8 -*- import urllib2 from BeautifulSoup import BeautifulSoup ...

Как получить определенную ячейку из таблицы с библ. beautifulsoup?
Столкнулся с проблемой при парсере сайта и не могу получить данную с табличке отдельно. Перепробовал всякое, но не могу сделать. Возможно...

Как вытащить значения из таблицы HTML используя BeautifulSoup
Здравствуйте! Я пытаюсь вытащить все значения из таблице, которые находятся в левой колонке с помощью beautifulSoup. Они находятся в теге...

Как Парсить несколько одинаковых XML тегов? (BeautifulSoup)
Имеется XML по типу: &lt;players&gt; &lt;player&gt; &lt;level&gt;5&lt;/level&gt; &lt;kills&gt;5&lt;/kills&gt; &lt;deaths&gt;5&lt;/deaths&gt; &lt;assists&gt;7&lt;/assists&gt; ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
30
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
Установка Emscripten SDK (emsdk) и CMake на Windows для сборки C и C++ приложений в WebAssembly (Wasm)
8Observer8 30.01.2026
Чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. Система контроля версиями Git. . .
Подключение Box2D v3 к SDL3 для Android: физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования. Часть библиотеки BedvitCOM Использованы. . .
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL3_image
8Observer8 27.01.2026
Содержание блога SDL3_image - это библиотека для загрузки и работы с изображениями. Эта пошаговая инструкция покажет, как загрузить и вывести на экран смартфона картинку с альфа-каналом, то есть с. . .
Влияние грибов на сукцессию
anaschu 26.01.2026
Бифуркационные изменения массы гриба происходят тогда, когда мы уменьшаем массу компоста в 10 раз, а скорость прироста биомассы уменьшаем в три раза. Скорость прироста биомассы может уменьшаться за. . .
Воспроизведение звукового файла с помощью SDL3_mixer при касании экрана Android
8Observer8 26.01.2026
Содержание блога SDL3_mixer - это библиотека я для воспроизведения аудио. В отличие от инструкции по добавлению текста код по проигрыванию звука уже содержится в шаблоне примера. Нужно только. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru