0 / 0 / 0
Регистрация: 11.02.2022
Сообщений: 52

Разметка страницы. Парсинг

21.02.2022, 16:22. Показов 5016. Ответов 1

Студворк — интернет-сервис помощи студентам
Браузер понимает, как и что нужно отображать на web-странице, потому что эти страницы написаны специальным языком разметки. Например, абзацы выделяются тегами <p></p>, то есть заключены между открывающим и закрывающим тегами определенного вида.

Не обращая внимания на все остальные теги и строки вообще без тегов, выделите только содержимое абзацев в порядке, обратном расположению на странице.

Формат ввода
Вводятся строки, пока не будет введен тег, закрывающий страницу: </html>

Формат вывода
Из строк нужно выделить текст между открывающим абзац тегом <p> и закрывающим </p>, из каждого абзаца собрать одну строку (она может оказаться длинной), и вывести получившиеся строки, начиная с низа страницы, то есть в обратном порядке. На остальные теги внимания не обращать.

Обратите внимание, что при склеивании строк между ними нужно добавить пробел.

Пример
Ввод
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Short poems</title>
</head>
<body>
Hi!
<p>What goes up when
the rain comes down?</p>
<p>What do you call a snowman in the summer?</p>
<p>Two little birds
Sitting on a wall,
One called Peter,
One called Paul.</p>
</body>
</html>

Вывод
Two little birds Sitting on a wall, One called Peter, One called Paul.
What do you call a snowman in the summer?
What goes up when the rain comes down?
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
21.02.2022, 16:22
Ответы с готовыми решениями:

Парсинг html страницы
Лаборатория 1. Осуществить ввод адреса Интернет-страницы. 2. Осуществить поиск всех изображений на странице. 3. Удалить дубликаты. ...

Парсинг, beautifulsoup, некорректная HTML разметка
Доброго времени суток! Изучаю парсинг сайтов. Beautifulsoup, lxml. Столкнулся с такой проблемой: при обращении к странице получаю...

Парсинг страницы
Здравствуйте! Есть проблема с получением информации с сайта. Отрывок кода страницы: &lt;div class='lesson lesson-lecture'...

1
8 / 8 / 0
Регистрация: 06.12.2022
Сообщений: 44
22.12.2022, 18:17
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
a = []
while True:
    x = input()
    if x == "</html>":
        break
    if "<p>" in x:
        res = x[3:]
        if "</p>" in res:
            res = res[:-4]
            a.append(res)
        else:
            while True:
                y = input()
                if "</p>" not in y:
                    res += f' {y}'
                else:
                    res += f' {y[:-4]}'
                    a.append(res)
                    break
print(*a[::-1], sep='\n')
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
22.12.2022, 18:17
Помогаю со студенческими работами здесь

Парсинг страницы
Здравствуйте! Столкнулся с такой проблемой, что не могу спарсить страницу. Я использовал BeautifulSoup для парсинга, но суть проблемы в...

Парсинг страницы
Здравствуйте,требуется написать программу на языке Python , которая парсит с сайта &quot;Викисловарь&quot; значение любого слова.

Парсинг страницы
Добрый вечер) Может кто подсказать. Я пытаюсь вытащить из страницы вот этот тег: &lt;dd...

Парсинг страницы
from urllib.request import urlopen from bs4 import BeautifulSoup import re def get_links(url): html = urlopen(url) ...

Парсинг html страницы
Здравствуйте. Есть видео где мужик парсит html страницу и далее заносит все ссылки которые нашёл:...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Опции темы

Новые блоги и статьи
Отчёт о спецтехнике находящейся в ремонте
Maks 20.04.2026
Отчёт из решения ниже размещен в конфигурации КА2. Задача: отобразить спецтехнику, которая на данный момент находится в ремонте. Есть нетиповой документ "Заявка на ремонт спецтехники" который. . .
Памятка для бота и "визитка" для читателей "Semantic Universe Layer (Слой семантической вселенной)"
Hrethgir 19.04.2026
Сгенерировано для краткого описания по случаю сборки и компиляции скелета серверного приложения. И пусть после этого скажут, что статьи сгенерированные AI - туфта и не интересно. И это не реклама -. . .
Запрет удаления строк ТЧ документа при определенном условии
Maks 19.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "Аккумуляторы", разработанного в конфигурации КА2. У данного документа есть ТЧ, в которой в зависимости от прав доступа. . .
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут Суть: - Группа наркоманов из 10 человек. - Только один инфицирован ВИЧ. - Колются одной иглой. - Колются раз в день. - Колются последовательно через. . .
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . . а удачный момент так и не приходит.
Фиксация колонок в отчете СКД
Maks 14.04.2026
Фиксация колонок в СКД отчета типа Таблица. Задача: зафиксировать три левых колонки в отчете. Процедура ПриКомпоновкеРезультата(ДокументРезультат, ДанныеРасшифровки, СтандартнаяОбработка) / / . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru