Форум программистов, компьютерный форум, киберфорум
Python: Решение задач
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.92/13: Рейтинг темы: голосов - 13, средняя оценка - 4.92
0 / 0 / 0
Регистрация: 10.11.2021
Сообщений: 16

Скраппинг сайта

08.02.2022, 21:56. Показов 2614. Ответов 1

Студворк — интернет-сервис помощи студентам
Есть вот такой сайт http://www.columbia.edu/~fdc/sample.html
Нужно реализовать программу, которая получает список всех подзаголовков сайта (они заключены в теги h3).


Результат:
['CONTENTS', '1. Creating a Web Page', '2. HTML Syntax', '3. Special Characters', '4. Converting Plain Text to HTML', '5. Effects', '6. Lists', '7. Links', '8. Tables', '9. Viewing Your Web Page', '10. Installing Your Web Page on the Internet', '11. Where to go from here', '12. Postscript: Cell Phones']
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
08.02.2022, 21:56
Ответы с готовыми решениями:

Вэб скраппинг
Доброго времени суток. Я начинающий программист, потихоньку учу Python, и вот мне дали выполнить один проект по вэб скрапингу. Я его...

Скраппинг новостей Озон
Добрый день! Помогите, пожалуйста, с таким вопросом. Есть тестовое задание - получить первые десять новостей с сайте Озон ...

Поясните мне чайнику, разница самописного сайта и сайта на движке из шаблона
Мне тут один создатель сайтов заявил что все серьезные сайты самописные. В принципе верю. Но вроде как сайт на движке из шаблона это прям...

1
 Аватар для avdivo
303 / 213 / 112
Регистрация: 03.12.2016
Сообщений: 409
09.02.2022, 02:19
Лучший ответ Сообщение было отмечено Lddrnox как решение

Решение

Lddrnox,
Python
1
2
3
4
5
6
7
8
9
10
11
import requests
from bs4 import BeautifulSoup
 
url = 'http://www.columbia.edu/~fdc/sample.html'
response = requests.get(url).content
soup = BeautifulSoup(response, "html.parser")
 
res = []
for link in soup.find_all('h3'):
    res.append(link.get_text())
print(res)
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
09.02.2022, 02:19
Помогаю со студенческими работами здесь

RSS-feed Отобразить текст с сайта без отображения самого сайта
Здравствуйте. При написании приложения для чтения rss ленты, возникла проблема: Появляется список заголовков новостей, после того, как...

Установка скрипта на страницу сайта с уже установленной страницы другого сайта
Здраствуйте. У меня такой вопрос. Каким образом можно установить скрипт на свою страницу с другого сайта? Подробнее. Есть страница с...

Интерактивный таймер обратного отчета на страницу сайта (не для сайта заглушки)
Всем добрый вечер,прошу помощи если это возможно. Необходимо создать простой таймер обратного отсчета который использует в работе только...

Как сделать папку c файлами сайта и имя сайта для apache?
как сделать папку c файлами сайта и имя сайта для apache?

При переносе второго сайта на хостинг открывается страница первого сайта
Перенес и установил ранее сохраненные данные базы и сайта на хостинг. Первый установленный сайт все нормально. Второй установленный после,...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит переходные токи и напряжения на элементах схемы. . . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru