Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.65/40: Рейтинг темы: голосов - 40, средняя оценка - 4.65
0 / 0 / 0
Регистрация: 14.03.2018
Сообщений: 70

Python + BeautifulSoup. Поиск содержимого в тегах

28.04.2021, 22:05. Показов 7821. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Всем доброго времени суток!
Может кто подскажет как работать с содержимым класса?
Конкретный вопрос:
Есть класс с тэгом div, включающий в себя классы с тэгом span.
Каждый класс со спэном содержит в себе текст или ссылки.
Необходимо вытащить определенный фрагмент текста который находиться в каком то из классов и может содержать [.] .
Ниже для большего понимания приведен конкретный фрагмент html, упрощенный для понимания.
Как из данного примера получить cod[.]online/Sea/index.html и cod[.]online/index.html ?

HTML5
1
2
3
4
5
6
7
< div class = "css-901oao r-18jsvk2 r-1qd0xha r-a023e6 r-16dba41 r-rjixqe r-bcqeeo r-bnwqim r-qvutc0">
      <span class = "css-901oao css-16my406 r-poiln3 r-bcqeeo r-qvutc0">Seems a new sample from </span>
      <span class = "css-901oao css-16my406 r-poiln3 r-bcqeeo r-qvutc0"> group, Victims are lured to open the bait doc
       URL:
       cod[.]online/Sea/index.html
       cod[.]online/index.html
      </span>
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
28.04.2021, 22:05
Ответы с готовыми решениями:

Python + BeautifulSoup
Всем привет. Есть 2 вопроса, может кто сталкивался подскажет: 1. При парсинге сайта нужно взять текст записи. После взятия класса,...

Не работает BeautifulSoup Python
Хочу запарсить с сайта из вот этого фрагмента HTML: &lt;td data-val=&quot;3248&quot;...

Python и Beautifulsoup кодировка
page = urllib2.urlopen(&quot;http://www.*******&quot;) soup = BeautifulSoup(page.read()) a = soup.findAll('a',{'class' : 'item'}) Получаю...

1
Эксперт Python
 Аватар для АмигоСП
295 / 108 / 57
Регистрация: 07.12.2016
Сообщений: 209
29.04.2021, 00:07
Лучший ответ Сообщение было отмечено Welemir1 как решение

Решение

Kamanaftius, из данного примера можно вот так получить:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
from bs4 import BeautifulSoup
import re
 
 
some_text = """<div class = "css-901oao r-18jsvk2 r-1qd0xha r-a023e6 r-16dba41 r-rjixqe r-bcqeeo r-bnwqim r-qvutc0">
      <span class = "css-901oao css-16my406 r-poiln3 r-bcqeeo r-qvutc0">Seems a new sample from </span>
      <span class = "css-901oao css-16my406 r-poiln3 r-bcqeeo r-qvutc0"> group, Victims are lured to open the bait doc
       URL:
       cod[.]online/Sea/index.html
       cod[.]online/index.html
      </span></div>"""
 
soup = BeautifulSoup(some_text, 'lxml')
need_value = soup.find('span', text=re.compile('[.]'))
url_values = re.findall(r'\w+\[.].+', need_value.text)
print(url_values)
2
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
29.04.2021, 00:07
Помогаю со студенческими работами здесь

Парсер Python BeautifulSoup
Всем доброго времени суток. Помогите пожалуйста решить вопрос. Я новичок в Пайтоне При парсинге сайтов с доменом &quot;ru&quot; выдает...

Подключить модуль BeautifulSoup Python
Мои данные: Python27 Windows XP Windows 7 Starter C:\Python27 ============================= Пытаюсь установить*модуль...

BeautifulSoup parser Python ( одинаковые атрибуты )
Подскажите пожалуйста - что делать если классы\id одинаковые во многих блоках, но данные содержащиеся в них разные.. Как достать к...

Парсинг форума через BeautifulSoup - Python
Самостоятельно занимаюсь изучением языка Python. Решил написать примитивный парсер сайта, используя библиотеку BeautifulSoup это код из...

Парсинг на Python. BeautifulSoup, bs4, requests
Добрый день. Нужна помощь от людей, кто работал с BeautifulSoup на Python. Пытаюсь получить со страницы проверки QR кода на ГосУслугах дату...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования. Часть библиотеки BedvitCOM Использованы. . .
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL3_image
8Observer8 27.01.2026
Содержание блога SDL3_image - это библиотека для загрузки и работы с изображениями. Эта пошаговая инструкция покажет, как загрузить и вывести на экран смартфона картинку с альфа-каналом, то есть с. . .
влияние грибов на сукцессию
anaschu 26.01.2026
Бифуркационные изменения массы гриба происходят тогда, когда мы уменьшаем массу компоста в 10 раз, а скорость прироста биомассы уменьшаем в три раза. Скорость прироста биомассы может уменьшаться за. . .
Воспроизведение звукового файла с помощью SDL3_mixer при касании экрана Android
8Observer8 26.01.2026
Содержание блога SDL3_mixer - это библиотека я для воспроизведения аудио. В отличие от инструкции по добавлению текста код по проигрыванию звука уже содержится в шаблоне примера. Нужно только. . .
Установка Android SDK, NDK, JDK, CMake и т.д.
8Observer8 25.01.2026
Содержание блога Перейдите по ссылке: https:/ / developer. android. com/ studio и в самом низу страницы кликните по архиву "commandlinetools-win-xxxxxx_latest. zip" Извлеките архив и вы увидите. . .
Вывод текста со шрифтом TTF на Android с помощью библиотеки SDL3_ttf
8Observer8 25.01.2026
Содержание блога Если у вас не установлены Android SDK, NDK, JDK, и т. д. то сделайте это по следующей инструкции: Установка Android SDK, NDK, JDK, CMake и т. д. Сборка примера Скачайте. . .
Использование SDL3-callbacks вместо функции main() на Android, Desktop и WebAssembly
8Observer8 24.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru