Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.65/40: Рейтинг темы: голосов - 40, средняя оценка - 4.65
0 / 0 / 0
Регистрация: 14.03.2018
Сообщений: 70

Python + BeautifulSoup. Поиск содержимого в тегах

28.04.2021, 22:05. Показов 7845. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Всем доброго времени суток!
Может кто подскажет как работать с содержимым класса?
Конкретный вопрос:
Есть класс с тэгом div, включающий в себя классы с тэгом span.
Каждый класс со спэном содержит в себе текст или ссылки.
Необходимо вытащить определенный фрагмент текста который находиться в каком то из классов и может содержать [.] .
Ниже для большего понимания приведен конкретный фрагмент html, упрощенный для понимания.
Как из данного примера получить cod[.]online/Sea/index.html и cod[.]online/index.html ?

HTML5
1
2
3
4
5
6
7
< div class = "css-901oao r-18jsvk2 r-1qd0xha r-a023e6 r-16dba41 r-rjixqe r-bcqeeo r-bnwqim r-qvutc0">
      <span class = "css-901oao css-16my406 r-poiln3 r-bcqeeo r-qvutc0">Seems a new sample from </span>
      <span class = "css-901oao css-16my406 r-poiln3 r-bcqeeo r-qvutc0"> group, Victims are lured to open the bait doc
       URL:
       cod[.]online/Sea/index.html
       cod[.]online/index.html
      </span>
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
28.04.2021, 22:05
Ответы с готовыми решениями:

Python + BeautifulSoup
Всем привет. Есть 2 вопроса, может кто сталкивался подскажет: 1. При парсинге сайта нужно взять текст записи. После взятия класса,...

Не работает BeautifulSoup Python
Хочу запарсить с сайта из вот этого фрагмента HTML: &lt;td data-val=&quot;3248&quot;...

Python и Beautifulsoup кодировка
page = urllib2.urlopen(&quot;http://www.*******&quot;) soup = BeautifulSoup(page.read()) a = soup.findAll('a',{'class' : 'item'}) Получаю...

1
Эксперт Python
 Аватар для АмигоСП
295 / 108 / 57
Регистрация: 07.12.2016
Сообщений: 209
29.04.2021, 00:07
Лучший ответ Сообщение было отмечено Welemir1 как решение

Решение

Kamanaftius, из данного примера можно вот так получить:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
from bs4 import BeautifulSoup
import re
 
 
some_text = """<div class = "css-901oao r-18jsvk2 r-1qd0xha r-a023e6 r-16dba41 r-rjixqe r-bcqeeo r-bnwqim r-qvutc0">
      <span class = "css-901oao css-16my406 r-poiln3 r-bcqeeo r-qvutc0">Seems a new sample from </span>
      <span class = "css-901oao css-16my406 r-poiln3 r-bcqeeo r-qvutc0"> group, Victims are lured to open the bait doc
       URL:
       cod[.]online/Sea/index.html
       cod[.]online/index.html
      </span></div>"""
 
soup = BeautifulSoup(some_text, 'lxml')
need_value = soup.find('span', text=re.compile('[.]'))
url_values = re.findall(r'\w+\[.].+', need_value.text)
print(url_values)
2
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
29.04.2021, 00:07
Помогаю со студенческими работами здесь

Парсер Python BeautifulSoup
Всем доброго времени суток. Помогите пожалуйста решить вопрос. Я новичок в Пайтоне При парсинге сайтов с доменом &quot;ru&quot; выдает...

Подключить модуль BeautifulSoup Python
Мои данные: Python27 Windows XP Windows 7 Starter C:\Python27 ============================= Пытаюсь установить*модуль...

BeautifulSoup parser Python ( одинаковые атрибуты )
Подскажите пожалуйста - что делать если классы\id одинаковые во многих блоках, но данные содержащиеся в них разные.. Как достать к...

Парсинг форума через BeautifulSoup - Python
Самостоятельно занимаюсь изучением языка Python. Решил написать примитивный парсер сайта, используя библиотеку BeautifulSoup это код из...

Парсинг на Python. BeautifulSoup, bs4, requests
Добрый день. Нужна помощь от людей, кто работал с BeautifulSoup на Python. Пытаюсь получить со страницы проверки QR кода на ГосУслугах дату...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Программный контроль заполнения реквизита табличной части документа
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: реализовать контроль заполнения реквизита табличной части. . .
wmic не является внутренней или внешней командой
Maks 02.04.2026
Решение: DISM / Online / Add-Capability / CapabilityName:WMIC~~~~ Отсюда: https:/ / winitpro. ru/ index. php/ 2025/ 02/ 14/ komanda-wmic-ne-naydena/
Программная установка даты и запрет ее изменения
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: при создании документов установить период списания автоматически. . .
Вывод данных в справочнике через динамический список
Maks 01.04.2026
Реализация из решения ниже выполнена на примере нетипового справочника "Спецтехника" разработанного в конфигурации КА2. Задача: вывести данные из ТЧ нетипового документа. . .
Функция заполнения текстового поля в реквизите формы документа
Maks 01.04.2026
Алгоритм из решения ниже реализован на нетиповом документе "ВыдачаОборудованияНаСпецтехнику" разработанного в конфигурации КА2, в дополнении к предыдущему решению. На форме документа создается. . .
К слову об оптимизации
kumehtar 01.04.2026
Вспоминаю начало 2000-х, университет, когда я писал на Delphi. Тогда среди программистов на форумах активно обсуждали аккуратную работу с памятью: нужно было следить за переменными, вовремя. . .
Идея фильтра интернета (сервер = слой+фильтр).
Hrethgir 31.03.2026
Суть идеи заключается в том, чтобы запустить свой сервер, о чём я если честно мечтал давно и давно приобрёл книгу как это сделать. Но не было причин его запускать. Очумелые учёные напечатали на. . .
Модель здравосоХранения 6. ESG-повестка и устойчивое развитие; углублённый анализ кадрового бренда
anaschu 31.03.2026
В прикрепленном документе раздумья о том, как можно поменять модель в будущем
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru