Форум программистов, компьютерный форум, киберфорум
Python: Решение задач
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
2 / 2 / 0
Регистрация: 20.04.2018
Сообщений: 48

Распарсить html строку по тегам через регулярки

25.10.2022, 16:25. Показов 582. Ответов 3

Студворк — интернет-сервис помощи студентам
Имеется html строка допустим
Info about Leela <span xml:lang="en" lang="en"><b><span>Turanga Leela</span></b></span><span>Super</span><span>girl</span>

Необходимо получить все теги этой строки (к примеру span) с самим телом, как видно у тегов есть вложенность, есть ли возможность получить каждый тег отдельно через регулярные выражения?
Вот результат:
<span xml:lang="en" lang="en"><b><span>Turanga Leela</span></b></span>
<span>Turanga Leela</span>
<span>Super</span>
<span>girl</span>
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
25.10.2022, 16:25
Ответы с готовыми решениями:

помогите распарсить HTML строку
Здравствуйте. Подскажите какое подобрать регулярное выражение чтобы распарсить вот такие строчки &lt;tr class=&quot;G1&quot;...

Распарсить строку HTML-кода
Всем привет. Посоветуйте как выйти из данной ситуации. Нужно вырезать ВСЁ из этого текста, &lt;div...

Regex: распарсить HTML-строку
Входная строка: Моя регулярка: Результат: Как видите, мне нужно получить текст стоящий перед &lt;x&gt;, но только в той...

3
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
25.10.2022, 18:22
С одним уровнем вложенности еще туда-сюда, а если больше, то алес

Добавлено через 1 минуту
Даже с одним уровнем монстр получится. Так что идея так себе.
Ну или циклами/рекурсией бегать с регулярками.

Добавлено через 7 минут
Хотя...
Python
1
2
3
4
import regex as re
 
s = 'Info about Leela <span xml:lang="en" lang="en"><b><span>Turanga Leela</span></b></span><span>Super</span><span>girl</span>'
print(*[i[0] for i in re.finditer(r'<(\w+).*?</\1>', s, overlapped=True)], sep='\n')
Code
1
2
3
4
5
<span xml:lang="en" lang="en"><b><span>Turanga Leela</span>
<b><span>Turanga Leela</span></b>
<span>Turanga Leela</span>
<span>Super</span>
<span>girl</span>
Dezoway, попрёт?

Добавлено через 43 секунды
Первая строчка некошерная
1
25.10.2022, 18:58

Не по теме:

del

Не пойдет, думал, может обычным способом можно.

0
2 / 2 / 0
Регистрация: 20.04.2018
Сообщений: 48
26.10.2022, 08:26  [ТС]
Пойдёт, спасибо!
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
26.10.2022, 08:26
Помогаю со студенческими работами здесь

Как распарсить строку с HTML-страницы
Здравствуйте форумчанены =) Подскажите, нужно из строки html файла, примерного вида &lt;area href=&quot;http://site.com/p2&quot;...

Каким способом лучше разить строку: через регулярки или сплитом?
Здравствуйте. Подскажите пожалуйста в следующем вопросе. Имеется строка такого вида: 199.72.81.55 - - &quot;GET /history/apollo/...

Распарсить html-строку и узнать, какой текст и как был отформатирован
Вообщем имеется строка такого типа &quot;new text&lt;b&gt;text b&lt;/b&gt;&lt;i&gt;text i&lt;b&gt;text b i &lt;/b&gt;&lt;/i&gt;&quot; Нужно достать обычный текст, жирный текст и...

Распарсить страницу через Html Agility Pack
Имеется страница с разметкой такого Типа : &lt;span id='1_46' class='tree1_1' onclick=&quot;collapse('1_46','2_46')&quot;;&gt;ФАКТОРЫ...

Парсинг по определенным html-тегам
Приветствую. Такая задача: есть html страница, в коде которой встречаются вот такие конструкции &lt;div...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru