Форум программистов, компьютерный форум, киберфорум
Python: Решение задач
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.71/21: Рейтинг темы: голосов - 21, средняя оценка - 4.71
0 / 0 / 0
Регистрация: 11.02.2022
Сообщений: 52

Разметка страницы. Парсинг

21.02.2022, 16:22. Показов 4860. Ответов 1

Студворк — интернет-сервис помощи студентам
Браузер понимает, как и что нужно отображать на web-странице, потому что эти страницы написаны специальным языком разметки. Например, абзацы выделяются тегами <p></p>, то есть заключены между открывающим и закрывающим тегами определенного вида.

Не обращая внимания на все остальные теги и строки вообще без тегов, выделите только содержимое абзацев в порядке, обратном расположению на странице.

Формат ввода
Вводятся строки, пока не будет введен тег, закрывающий страницу: </html>

Формат вывода
Из строк нужно выделить текст между открывающим абзац тегом <p> и закрывающим </p>, из каждого абзаца собрать одну строку (она может оказаться длинной), и вывести получившиеся строки, начиная с низа страницы, то есть в обратном порядке. На остальные теги внимания не обращать.

Обратите внимание, что при склеивании строк между ними нужно добавить пробел.

Пример
Ввод
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Short poems</title>
</head>
<body>
Hi!
<p>What goes up when
the rain comes down?</p>
<p>What do you call a snowman in the summer?</p>
<p>Two little birds
Sitting on a wall,
One called Peter,
One called Paul.</p>
</body>
</html>

Вывод
Two little birds Sitting on a wall, One called Peter, One called Paul.
What do you call a snowman in the summer?
What goes up when the rain comes down?
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
21.02.2022, 16:22
Ответы с готовыми решениями:

Парсинг html страницы
Лаборатория 1. Осуществить ввод адреса Интернет-страницы. 2. Осуществить поиск всех изображений на странице. 3. Удалить дубликаты. ...

Парсинг, beautifulsoup, некорректная HTML разметка
Доброго времени суток! Изучаю парсинг сайтов. Beautifulsoup, lxml. Столкнулся с такой проблемой: при обращении к странице получаю...

Парсинг страницы
Здравствуйте! Есть проблема с получением информации с сайта. Отрывок кода страницы: &lt;div class='lesson lesson-lecture'...

1
8 / 8 / 0
Регистрация: 06.12.2022
Сообщений: 44
22.12.2022, 18:17
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
a = []
while True:
    x = input()
    if x == "</html>":
        break
    if "<p>" in x:
        res = x[3:]
        if "</p>" in res:
            res = res[:-4]
            a.append(res)
        else:
            while True:
                y = input()
                if "</p>" not in y:
                    res += f' {y}'
                else:
                    res += f' {y[:-4]}'
                    a.append(res)
                    break
print(*a[::-1], sep='\n')
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
22.12.2022, 18:17
Помогаю со студенческими работами здесь

Парсинг страницы
Здравствуйте! Столкнулся с такой проблемой, что не могу спарсить страницу. Я использовал BeautifulSoup для парсинга, но суть проблемы в...

Парсинг страницы
Здравствуйте,требуется написать программу на языке Python , которая парсит с сайта &quot;Викисловарь&quot; значение любого слова.

Парсинг страницы
Добрый вечер) Может кто подсказать. Я пытаюсь вытащить из страницы вот этот тег: &lt;dd...

Парсинг страницы
from urllib.request import urlopen from bs4 import BeautifulSoup import re def get_links(url): html = urlopen(url) ...

Парсинг html страницы
Здравствуйте. Есть видео где мужик парсит html страницу и далее заносит все ссылки которые нашёл:...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование . \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json> Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом. # Check if. . .
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так: https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347 Основана на STM32F303RBT6. На борту пять. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru