С Новым годом! Форум программистов, компьютерный форум, киберфорум
Python: Решение задач
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.71/21: Рейтинг темы: голосов - 21, средняя оценка - 4.71
0 / 0 / 0
Регистрация: 11.02.2022
Сообщений: 52

Разметка страницы. Парсинг

21.02.2022, 16:22. Показов 4716. Ответов 1

Студворк — интернет-сервис помощи студентам
Браузер понимает, как и что нужно отображать на web-странице, потому что эти страницы написаны специальным языком разметки. Например, абзацы выделяются тегами <p></p>, то есть заключены между открывающим и закрывающим тегами определенного вида.

Не обращая внимания на все остальные теги и строки вообще без тегов, выделите только содержимое абзацев в порядке, обратном расположению на странице.

Формат ввода
Вводятся строки, пока не будет введен тег, закрывающий страницу: </html>

Формат вывода
Из строк нужно выделить текст между открывающим абзац тегом <p> и закрывающим </p>, из каждого абзаца собрать одну строку (она может оказаться длинной), и вывести получившиеся строки, начиная с низа страницы, то есть в обратном порядке. На остальные теги внимания не обращать.

Обратите внимание, что при склеивании строк между ними нужно добавить пробел.

Пример
Ввод
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Short poems</title>
</head>
<body>
Hi!
<p>What goes up when
the rain comes down?</p>
<p>What do you call a snowman in the summer?</p>
<p>Two little birds
Sitting on a wall,
One called Peter,
One called Paul.</p>
</body>
</html>

Вывод
Two little birds Sitting on a wall, One called Peter, One called Paul.
What do you call a snowman in the summer?
What goes up when the rain comes down?
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
21.02.2022, 16:22
Ответы с готовыми решениями:

Парсинг html страницы
Лаборатория 1. Осуществить ввод адреса Интернет-страницы. 2. Осуществить поиск всех изображений на странице. 3. Удалить дубликаты. ...

Парсинг, beautifulsoup, некорректная HTML разметка
Доброго времени суток! Изучаю парсинг сайтов. Beautifulsoup, lxml. Столкнулся с такой проблемой: при обращении к странице получаю...

Парсинг страницы
Здравствуйте! Есть проблема с получением информации с сайта. Отрывок кода страницы: &lt;div class='lesson lesson-lecture'...

1
8 / 8 / 0
Регистрация: 06.12.2022
Сообщений: 44
22.12.2022, 18:17
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
a = []
while True:
    x = input()
    if x == "</html>":
        break
    if "<p>" in x:
        res = x[3:]
        if "</p>" in res:
            res = res[:-4]
            a.append(res)
        else:
            while True:
                y = input()
                if "</p>" not in y:
                    res += f' {y}'
                else:
                    res += f' {y[:-4]}'
                    a.append(res)
                    break
print(*a[::-1], sep='\n')
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
22.12.2022, 18:17
Помогаю со студенческими работами здесь

Парсинг страницы
Здравствуйте! Столкнулся с такой проблемой, что не могу спарсить страницу. Я использовал BeautifulSoup для парсинга, но суть проблемы в...

Парсинг страницы
Здравствуйте,требуется написать программу на языке Python , которая парсит с сайта &quot;Викисловарь&quot; значение любого слова.

Парсинг страницы
Добрый вечер) Может кто подсказать. Я пытаюсь вытащить из страницы вот этот тег: &lt;dd...

Парсинг страницы
from urllib.request import urlopen from bs4 import BeautifulSoup import re def get_links(url): html = urlopen(url) ...

Парсинг html страницы
Здравствуйте. Есть видео где мужик парсит html страницу и далее заносит все ссылки которые нашёл:...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути
Programma_Boinc 01.01.2026
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути Сочетание глобально распределённой вычислительной мощности и инновационных. . .
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru