Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.63/8: Рейтинг темы: голосов - 8, средняя оценка - 4.63
0 / 0 / 0
Регистрация: 02.03.2020
Сообщений: 105

Парсинг сайта

05.11.2020, 11:48. Показов 1759. Ответов 12

Студворк — интернет-сервис помощи студентам
Здравствуйте! Хотел вытащить ссылки из главного меня сайта, но получается вытащить все.

Python
1
2
for link in soup.find_all('a'):
    print(link.get('href'))
Подскажите, пожалуйста, как вытащить только необходимые ссылки? /authors/, /poems/, /boards/
Миниатюры
Парсинг сайта  
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
05.11.2020, 11:48
Ответы с готовыми решениями:

Парсинг сайта
учусь парсингу сайтов на python. from bs4 import BeautifulSoup with open('project1.html') as file: src = file.read() ...

Асинхронный парсинг сайта
Здраствуйте, может кто подсказать в чём заключается ошибка в коде? (задумка кода в получении прокси с сайта hidemy) код: from...

Парсинг из сайта погоды
здравствуйте, помогите пожалуйста. парсинг из сайта https://pogoda.by/ почему выдает ошибку: line 11, in print(names.text) ...

12
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7392 / 4819 / 1246
Регистрация: 30.03.2015
Сообщений: 13,694
Записей в блоге: 29
05.11.2020, 13:57
hihihihihi, ну так бери первые 3 из полученного списка
0
0 / 0 / 0
Регистрация: 02.03.2020
Сообщений: 105
05.11.2020, 14:36  [ТС]
Цитата Сообщение от Welemir1 Посмотреть сообщение
бери первые 3 из полученног
Там до необходимых мне ссылок, есть еще ссылки.
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7392 / 4819 / 1246
Регистрация: 30.03.2015
Сообщений: 13,694
Записей в блоге: 29
05.11.2020, 14:37
hihihihihi, бери все и отфильтруй только те, где хреф содержит authors, poems или boards
0
0 / 0 / 0
Регистрация: 02.03.2020
Сообщений: 105
05.11.2020, 14:42  [ТС]
Цитата Сообщение от Welemir1 Посмотреть сообщение
отфильтруй только те, где хреф содержит
Я не знаю как это сделать(
0
Эксперт Python
 Аватар для АмигоСП
295 / 108 / 57
Регистрация: 07.12.2016
Сообщений: 209
05.11.2020, 15:14
Лучший ответ Сообщение было отмечено hihihihihi как решение

Решение

hihihihihi, ну вам же уважаемый Welemir1 уже все расписал. Ну как может быть непонятна такая элементарщина? Вот для примера вам. Разбирайтесь.
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
import requests
from bs4 import BeautifulSoup
 
response = requests.get('https://stihi.ru/')
soup = BeautifulSoup(response.text, 'lxml')
# Вариант №1
tag_a = soup.find_all('a')
check = ('Авторы','Произведения','Рецензии')
need_links = set()
for a_link in tag_a:
    if a_link.text in check:
        need_links.add(a_link['href'])
print(need_links)
# Вариант №2
rawdata = soup.find('ul', attrs={'class':'headmenu'})
links = rawdata.find_all('a')[:3]
for link in links:
    print(link['href'])
2
5042 / 1069 / 149
Регистрация: 29.01.2013
Сообщений: 6,242
06.11.2020, 15:04
Цитата Сообщение от АмигоСП Посмотреть сообщение
Ну как может быть непонятна такая элементарщина
да-да, а 2 книжки по теме и 8 книжек по смежным темам, которые вы прочитали перед таким оценочным суждением, мы опустим как несущественные)))
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7392 / 4819 / 1246
Регистрация: 30.03.2015
Сообщений: 13,694
Записей в блоге: 29
06.11.2020, 15:08
Alli_Lupin, с козырей зашел))
0
5042 / 1069 / 149
Регистрация: 29.01.2013
Сообщений: 6,242
06.11.2020, 15:11
Welemir1, да несколько шокируют меня ребята, которые с криком "это же элементарно!" Хреначат по столу инструкцией к синхрофазотрону)
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7392 / 4819 / 1246
Регистрация: 30.03.2015
Сообщений: 13,694
Записей в блоге: 29
06.11.2020, 15:18
Alli_Lupin, прямо вживую представил )))
как рассказывал один знакомый - им профессор, исписав 4 доску формулами (чего то там Виноградова) говорил:
"Это должен знать каждый интиллигентный человек!"

а по сути он верно пожурил халявщика, ему ж все объяснили, просто не хочет сам решать.
0
06.11.2020, 15:25

Не по теме:

Welemir1, о да) представим, что человек никогда не видел паяльник, не знает где он греется, как им пользоваться, никогда не видел в живую радиоэлементов в smd-корпусах, а ему говорят: вон, спаяй по трафарету. Всё ж просто. Если вы подобного не видели, то я вам опишу что будет.
1. ожог на пальцах
2. не хватило элементов
3. элементы пропаяны в случайном порядке
4. часть элементов сгорела от такой пайки.

аналогия грубая, но достаточно точно описывает происходящее. Человек взялся за задачу явно не по уровню, а вы в него общими словами. Естественно он рад готовому решению.

0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7392 / 4819 / 1246
Регистрация: 30.03.2015
Сообщений: 13,694
Записей в блоге: 29
06.11.2020, 15:38
Alli_Lupin, сразу видно, что ты отдохнул, из отпуска. Ничего, порешаешь задачки яндексоидам, через пару недель поговорим)))
0
5042 / 1069 / 149
Регистрация: 29.01.2013
Сообщений: 6,242
06.11.2020, 15:48
Welemir1, я их не решаю)))
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
06.11.2020, 15:48
Помогаю со студенческими работами здесь

Парсинг сайта по вакансиям на python
Всем привет, пробую себя в парсинге впервые, до определенного момента все шло хорошо, но когда нужно вывести названия вакансий в виде...

Парсинг: получить все термины с сайта
Добрый день Очень нужна Ваша помощь. Мне нужно получить с сайта http://www.ekonomiks.net.ua/ все термины. Я смог сделать, чтобы...

Парсинг изображений и их сохранение с сайта,работает, но загружаются не все
Доброго времени суток! Задача: загрузить с сайта, к примеру, https://yandex.ru/images/search?text=zebra, 1000 изображений. Пытаюсь...

Парсинг сайта
import requests from bs4 import BeautifulSoup pric=*4 q=0 for j in range(1,2): url =...

Парсинг сайта
У меня есть парсер цен AliExpress, он на селениуме, проблема в том что он медленный, хотелось более быстрой работы, bs4 не видит нужные...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
13
Ответ Создать тему
Новые блоги и статьи
Отправка уведомления на почту при изменении наименования справочника
Maks 24.03.2026
Программная отправка письма электронной почты на примере изменения наименования справочника "Склады" в конфигурации БП3. Перед реализацией необходимо выполнить настройку системной учетной записи. . .
модель ЗдравоСохранения 5. Меньше увольнений- больше дохода!
anaschu 24.03.2026
Теперь система здравосохранения уменьшает количество увольнений. 9TO2GP2bpX4 a42b81fb172ffc12ca589c7898261ccb/ https:/ / rutube. ru/ video/ a42b81fb172ffc12ca589c7898261ccb/ Слева синяя линия -. . .
Midnight Chicago Blues
kumehtar 24.03.2026
Такой Midnight Chicago Blues, знаешь?. . Когда вечерние улицы становятся ночными, а ты не можешь уснуть. Ты идёшь в любимый старый бар, и бармен наливает тебе виски. Ты смотришь на пролетающие. . .
Контроль уникальности заводского номера - вариант №2
Maks 24.03.2026
В отличие от предыдущего варианта добавлено прерывание циклов, также добавлены новые переменные для сохранения контекста ошибки перед прерыванием цикла: Процедура ПередЗаписью(Отказ, РежимЗаписи,. . .
SDL3 для Desktop (MinGW): Вывод текста со шрифтом TTF с помощью библиотеки SDL3_ttf на Си и C++
8Observer8 24.03.2026
Содержание блога Финальные проекты на Си и на C++: finish-text-sdl3-c. zip finish-text-sdl3-cpp. zip
Жизнь в неопределённости
kumehtar 23.03.2026
Жизнь — это постоянное существование в неопределённости. Например, даже если у тебя есть список дел, невозможно дойти до точки, где всё окончательно завершено и больше ничего не осталось. В принципе,. . .
Модель здравоСохранения: работники работают быстрее после её введения.
anaschu 23.03.2026
geJalZw1fLo Корпорация до введения программа здравоохранения имела много невыполненных работниками заданий, после введения программы количество заданий выросло. Но на выплатах по больничным это. . .
Контроль уникальности заводского номера - вариант №1
Maks 23.03.2026
Алгоритм контроля уникальности заводского (или серийного) номера на примере документа выдачи шин для спецтехники с табличной частью в конфигурации КА2. Данные берутся из регистра сведений, по. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru