Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.84/64: Рейтинг темы: голосов - 64, средняя оценка - 4.84
4 / 4 / 2
Регистрация: 07.05.2014
Сообщений: 489

Парсинг новостей

04.05.2019, 11:47. Показов 12014. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Я пишу парсер для получения 5 новостей на главной странице яндекса, но вместо этого он присылает больше чем 5, и новости из моего региона тоже берет больше 5. То есть он присылает все.
Python
1
2
3
4
5
6
7
8
9
10
11
import requests
from bs4 import BeautifulSoup
 
d=[]
 
url = 'https://yandex.ru'
r = requests.get(url)
soup = BeautifulSoup(r.text, 'html.parser')
 
for link in soup.find_all('a', class_ =  'home-link list__item-content home-link_black_yes'):
    print(link.text)
0
Лучшие ответы (1)
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
04.05.2019, 11:47
Ответы с готовыми решениями:

Парсер новостей
Здравствуйте, подскажите как получить комментарии к новостям. В списке links находятся ссылки на новость в отдельной вкладке. При пере ...

Парсинг по порядку или парсинг до определенного тега
Доброго времени друзья! Подскажите пожалуйста, к примеру есть вот такой html код: <div class="container mt-3"> ...

Парсинг новостей
Есть задание пропарсить новости, взять оттуда время, заголовок, информацию и ссылку на неё. Алгоритм я вижу такой: сначала получить ul, где...

3
 Аватар для Vigi
641 / 481 / 179
Регистрация: 28.05.2012
Сообщений: 1,419
04.05.2019, 12:48
Python
1
2
for link in soup.find_all('a', class_='home-link list__item-content home-link_black_yes')[:5]:
    print(link.text)
1
4 / 4 / 2
Регистрация: 07.05.2014
Сообщений: 489
04.05.2019, 13:04  [ТС]
А как тогда получить новости региона? Сейчас он их не выводит. Подскажите, пожалуйста.

Добавлено через 5 минут
Просто я запрашивал новости и он мне отправляли и региона.
0
 Аватар для Vigi
641 / 481 / 179
Регистрация: 28.05.2012
Сообщений: 1,419
04.05.2019, 17:03
Лучший ответ Сообщение было отмечено Rodmistar как решение

Решение

Python
1
2
for link in soup.find_all('a', class_='home-link list__item-content home-link_black_yes')[10: 15]:
    print(link.text)
Добавлено через 8 минут
В общем так:
[ : 10] - все world news
[10: ] - региональные
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
04.05.2019, 17:03
Помогаю со студенческими работами здесь

Парсинг новостей
Добрый день уважаемые форумчане, нужна ваша помощь. Хочу написать прогу для парсинга новостей, например с сайта yandex.ru. Но уровень моих...

Парсинг новостей
Доброго времени суток, делаю приложение для конференции, хочу реализовать в ней новости и программу событий на конференции. Сайта откуда...

Парсинг новостей
Здравствуйте! Помогите с заданием пожалуйста Парсить несколько новостей с сайта, например верхний блок новостей https://www.ukr.net/ ...

Парсинг новостей
Такой вопрос. Как для seo будет лучше... К примеру необходимо парсить новости с другого сайта. Два варианта. Первый. Это толь...

Парсинг новостей
Добрый день, пытаюсь спарсить новости с сайта ВУЗа https://bspu.ru/unit/19/news с помощью HtmlAgilityPack. Хочу вывести ссылки на новости...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование . \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json> Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом. # Check if. . .
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так: https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347 Основана на STM32F303RBT6. На борту пять. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru