0 / 0 / 0
Регистрация: 31.05.2020
Сообщений: 1

Парсинг сайта

10.07.2022, 22:51. Показов 575. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
учусь парсингу сайтов на python.

from bs4 import BeautifulSoup
with open('project1.html') as file:
src = file.read()


soup = BeautifulSoup(src, "lxml")
title = soup.title
print(title.text)

вот такая программа, выводит хрень Главная страница блога, хотя должна выводить "главная страница блога"


что делать?
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
10.07.2022, 22:51
Ответы с готовыми решениями:

Парсинг сайта
Здравствуйте! Хотел вытащить ссылки из главного меня сайта, но получается вытащить все. for link in soup.find_all('a'): ...

Парсинг из сайта погоды
здравствуйте, помогите пожалуйста. парсинг из сайта https://pogoda.by/ почему выдает ошибку: line 11, in print(names.text) ...

Асинхронный парсинг сайта
Здраствуйте, может кто подсказать в чём заключается ошибка в коде? (задумка кода в получении прокси с сайта hidemy) код: from...

2
Эксперт по компьютерным сетям
 Аватар для Jabbson
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
11.07.2022, 00:12
Цитата Сообщение от MishaErmolin Посмотреть сообщение
что делать?
страдать! ну хоть файлом поделись бы.

Вангую, что поможет

Python
1
with open('project1.html', encoding="windows-1251") as file:
0
0 / 0 / 0
Регистрация: 16.07.2022
Сообщений: 23
17.07.2022, 00:40
Привет! Напиши мне в тг @ medwar
Сам пару дней изучаю парсинг
основы питона знаю
Вместе будет легче
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
17.07.2022, 00:40
Помогаю со студенческими работами здесь

Парсинг сайта по вакансиям на python
Всем привет, пробую себя в парсинге впервые, до определенного момента все шло хорошо, но когда нужно вывести названия вакансий в виде...

Парсинг: получить все термины с сайта
Добрый день Очень нужна Ваша помощь. Мне нужно получить с сайта http://www.ekonomiks.net.ua/ все термины. Я смог сделать, чтобы...

Парсинг изображений и их сохранение с сайта,работает, но загружаются не все
Доброго времени суток! Задача: загрузить с сайта, к примеру, https://yandex.ru/images/search?text=zebra, 1000 изображений. Пытаюсь...

Парсинг сайта
Вообщем нужно спарсить сайт https://tarkov-market.com/. Я парсю первые 10 элементов в таблице, но потом нужно подгружать...

Парсинг сайта
Здравствуйте! Подскажите, пожалуйста, как достать с сайта дату, только, чтобы не всю, а сначало число, потом месяц, и потом год? С помощью...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Опции темы

Новые блоги и статьи
Реалии
Hrethgir 01.03.2026
Нет, я не закончил до сих пор симулятор. Эта задача сложнее. Не получилось уйти в плавсостав, но оно и к лучшему, возможно. Точнее получалось - но сварщиком в палубную команду, а это значит, в моём. . .
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
SDL3 для Web (WebAssembly): Сборка библиотек: SDL3, Box2D, FreeType, SDL3_ttf, SDL3_mixer и SDL3_image из исходников с помощью CMake и Emscripten
8Observer8 27.02.2026
Недавно вышла версия 3. 4. 2 библиотеки SDL3. На странице официальной релиза доступны исходники, готовые DLL (для x86, x64, arm64), а также библиотеки для разработки под Android, MinGW и Visual Studio. . . .
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование . \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json> Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом. # Check if. . .
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так: https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347 Основана на STM32F303RBT6. На борту пять. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru