Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.73/190: Рейтинг темы: голосов - 190, средняя оценка - 4.73
2 / 2 / 1
Регистрация: 08.11.2019
Сообщений: 79

BeautifulSoup Как получить текстовое содержимое тега 'span'

10.11.2019, 18:41. Показов 36171. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Задача - получить "Нужный текст" из всех тегов <span class="value">Нужный текст</span>

Получить теги вместе с содержимым просто -
Python
1
2
3
4
5
6
7
8
        soup = bs(request.content, 'html.parser')
        div = soup.find_all('div', {'class': 'show-all-target'})
        for spans in div:
            spans = spans.find_all('span', {'class': 'value'})
            print(spans)
 
# Результат:
# [<span class="value">Нужный текст</span>, <span class="value">Нужный текст</span>, <span class="value">Нужный текст</span>]

А вот с получением содержимого возникли проблемы.
Пробовал, как везде рекомендуется, добавить опцию .text
Python
1
2
3
4
spans = spans.find_all('span', {'class': 'value'}).text
 
# и с другим способом описания атрибутов тега
spans = spans.find_all('span', attrs={'class': 'value'}).text
Пробовал рекомендацию из этого сообщения.

Python
1
2
3
4
5
6
        soup = bs(request.content, 'html.parser')
        div = soup.find_all('div', {'class': 'show-all-target'})
        for spans in div1:
            spans = spans.find('span', {'class': 'value'})
            spans = spans.get_text(strip=True)
            print(spans)

Всё это работает, НО только если используется .find или .find_next, которые выдают только один найденный результат.
Мне же нужно .find_all, чтобы найти все теги и их содержимое.

Но при использовании .find_all получаю следующую ошибку -
"ResultSet object has no attribute '%s'. You're probably treating a list of items like a single item. Did you call find_all() when you meant to call find()?" % key
AttributeError: ResultSet object has no attribute 'get_text'. You're probably treating a list of items like a single item. Did you call find_all() when you meant to call find()?

Помогите, пожалуйста, разобраться как найти все нужные теги и получить из них содержимое в виде текста.
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
10.11.2019, 18:41
Ответы с готовыми решениями:

Как получить содержимое тега span
url = input(&quot;Введите URL:&quot;) info = requests.get(url).text soup = BeautifulSoup(info, &quot;lxml&quot;) block =...

BeautifulSoup содержимое параметра тега
С помощью BeautifulSoup получаю список ссылок следующего вида &lt;a href=&quot;#91&quot; id=&quot;45&quot; title=&quot;Hello 123&quot;&gt;91&lt;/a&gt; &lt;a...

Как скопировать всё содержимое тега (включая другие теги и их содержимое) и вставить внутрь другого тега
Пробовал .clone $(&quot;.la_desktop&quot;).clone().appendTo(&quot;.la_mobile&quot;); HTML: &lt;div class=&quot;l_articles la_desktop&quot;&gt; ...

2
0 / 0 / 0
Регистрация: 21.09.2020
Сообщений: 1
21.09.2020, 11:17
Для тех кто будет искать ответ на этот же вопрос приведу пример парсинга новостей со страницы яндекса:

Python
1
2
3
4
5
6
7
import requests
from bs4 import BeautifulSoup
req=requests.get("https://yandex.ru/")
soup = BeautifulSoup(req.text, "html.parser")
st=soup.findAll("span", {'class': 'news__item-content'})
for i in range(0,5,1):
    print(st[i].get_text())
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7392 / 4819 / 1246
Регистрация: 30.03.2015
Сообщений: 13,694
Записей в блоге: 29
21.09.2020, 12:10
Цитата Сообщение от Serg0_0 Посмотреть сообщение
st=soup.findAll("span", {'class': 'news__item-content'})
for i in range(0,5,1):
    print(st[i].get_text())
Python
1
2
3
elements=soup.findAll("span", {'class': 'news__item-content'})
for element in elements:
    print(element.get_text())
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
21.09.2020, 12:10
Помогаю со студенческими работами здесь

Получить значение из тега span в переменную
Добрый день, есть вот такой код &lt;span class=&quot;align_right price&quot;&gt; &lt;b&gt; 2300 &lt;/b&gt; руб. &lt;/span&gt; Как из...

Получить значение из тега <span>, сравнить с имеющимся
Добрый день, уважаемые форумчане! Ввиду своих невысоких познаний и острой необходимости решить стоящую задачу, вынужден обратиться с...

Как получить содержимое тега без учета работы скриптов JS?
Сделал я простенький браузерный редактор WYSIWYG. Все работает, но возникает проблема с контентом, который сформирован или изменен...

Как выделить текст из тега через BeautifulSoup?
Написал такой скрипт: #!/usr/bin/env python # -*- coding: utf-8 -*- import urllib2 from BeautifulSoup import BeautifulSoup ...

Получить значение тега из файла xml в текстовое поле
Всем привет. Как можно получить значение тега &lt;UserName&gt; из файла xml в текстовое поле на форме?


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
Контроль заполнения и очистка дат в зависимости от значения перечислений
Maks 12.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: реализовать контроль корректности заполнения дат назначения. . .
Архитектура слоя интернета для сервера-слоя.
Hrethgir 11.04.2026
В продолжение https:/ / www. cyberforum. ru/ blogs/ 223907/ 10860. html Знаешь что я подумал? Раз мы все источники пишем в голове ветки, то ничего не мешает добавить в голову такой источник, который сам. . .
Подстановка значения реквизита справочника в табличную часть документа
Maks 10.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: при выборе сотрудника (справочник Сотрудники) в ТЧ документа. . .
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях. Задача: при копировании документа очищать определенные реквизиты и табличную. . .
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели 8ATzM_2aurI
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2. Задача: запретить редактирование документа, если он открыт у другого пользователя. / / . . .
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои. А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20% kYBz3eJf3jQ
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru