Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/9: Рейтинг темы: голосов - 9, средняя оценка - 4.67
0 / 0 / 0
Регистрация: 30.04.2021
Сообщений: 12

Перебор url

13.02.2022, 17:45. Показов 2016. Ответов 2

Студворк — интернет-сервис помощи студентам
Всем привет! Нужна помощь с автоматизацией следующих действий:

1) Есть ссылка на определенную страницу типа https://.../files/2000
2) Нужно перебирать ссылки (т.е. открывать .../files/2000, потом .../files/2001, .../files/2002 и т.д.) в браузере и закрывать их, если название заголовка страницы (пример в закрепе) будет не "Страница не найдена".
Т.е. открывается страница https://.../files/2000, если в названии вкладки будет "Страница не найдена", то следует ее закрыть и перейти к следующей странице https://.../files/2001

Посоветуйте, пожалуйста, как это возможно сделать. Ранее вообще не работал с Web. Буду чрезмерно благодарен!
Изображения
 
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
13.02.2022, 17:45
Ответы с готовыми решениями:

Перебор URL
Написать программу для перебора URL сайта построенных на числовом идентификаторе.

Открыть URL (там ссылка, которая совершает переход на другой URL) и вытянуть новый URL
Стоит задача по одному URL получить другой Пробовал открывать URL через webbrowser, но это не совсем то, что нужно, в идеале вообще не...

Как спуститься на url уровнем ниже, или перейти из url одного приложения в url другого?
Допустим есть приложение cat и приложение dog. В корневом urls.py прописанно: from django.contrib import admin from django.urls...

2
148 / 111 / 37
Регистрация: 28.11.2013
Сообщений: 383
13.02.2022, 20:06
Лучший ответ Сообщение было отмечено Zow1X как решение

Решение

Непонятно, что вы должны делать если страница найдена?
Если вам надо найти номер страницы, то можно и без браузера с помощью requests сделать. Код будет примерно такой
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
import requests
from bs4 import BeautifulSoup
import time
import lxml
 
start_page = 2000
finish_page = 2010
 
url = "https://.../files/"
 
for i in range(start_page, finish_page):
    time.sleep(2)
    response = requests.get(f'{url}/{i}')
    soup = BeautifulSoup(response.text, "lxml")
    title = soup.title.text
    if title != "Страница не найдена":
        # делать что-то если страница найдена
        pass
Ну а если нужен браузер, то вместо requests надо использовать библиотеку selenium

Добавлено через 8 минут
Вместо текста "Страница не найдена" можно проверять статус код ответа сервера, если он не 200, то страница не найдена.
Python
1
2
3
4
5
6
    if response.status_code == 200:
        # делать что-то если страница найдена
        pass
    else:
        # делать что-то если страница не найдена
        pass
1
0 / 0 / 0
Регистрация: 30.04.2021
Сообщений: 12
13.02.2022, 20:14  [ТС]
Спасибо большое, выручили, буду пытаться разобрать все это! А так, в итоге хотелось бы чтобы бы, просто были открыты страницы, которые не "Страница не найдена". Т.е. в браузере открылись вкладки с найденными страницами.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
13.02.2022, 20:14
Помогаю со студенческими работами здесь

Из списка URL, вернуть список только тех URL, в которых есть /catalog/
def catalog_finder(url_list): # your code here result_list = None return result_list

Как считать url со строки ввода в виджете и потом при нажатии кнопки этого виджета открыть url браузером
Помогите пожалуйста Балбесу. В Tkinter создал виджет с окном ввода и кнопкой. А как это все связать не понимаю. Я уже и книги читал и видео...

Перебор url и перезапуск скрипта
Всем привет! Подскажите как реализовать следующую задумку. Необходимо перебрать некоторое количество url вида сайт.ру/index.php&page=1...

Перебор через URL + извлечение данных по странице
Друзья мои, приветствую! Совсем недавно начал работать с JS и возникло несколько вопросов. В частности, нужно решить вот какую...

Полный перебор и сокращенный перебор, путем исключения одного цикла
1) Разработать на основе метода полного перебора программу razmen1 для решения задачи о способах размена купюры достоинством 100 условных...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
Вывод данных через динамический список в справочнике
Maks 01.04.2026
Реализация из решения ниже выполнена на примере нетипового справочника "Спецтехника" разработанного в конфигурации КА2. Задача: вывести данные из ТЧ нетипового документа. . .
Функция заполнения текстового поля в реквизите формы документа
Maks 01.04.2026
Алгоритм из решения ниже реализован на нетиповом документе "ВыдачаОборудованияНаСпецтехнику" разработанного в конфигурации КА2, в дополнении к предыдущему решению. На форме документа создается. . .
К слову об оптимизации
kumehtar 01.04.2026
Вспоминаю начало 2000-х, университет, когда я писал на Delphi. Тогда среди программистов на форумах активно обсуждали аккуратную работу с памятью: нужно было следить за переменными, вовремя. . .
Идея фильтра интернета (сервер = слой+фильтр).
Hrethgir 31.03.2026
Суть идеи заключается в том, чтобы запустить свой сервер, о чём я если честно мечтал давно и давно приобрёл книгу как это сделать. Но не было причин его запускать. Очумелые учёные напечатали на. . .
Модель здравосоХранения 6. ESG-повестка и устойчивое развитие; углублённый анализ кадрового бренда
anaschu 31.03.2026
В прикрепленном документе раздумья о том, как можно поменять модель в будущем
10 пpимет, которые всегда сбываются
Maks 31.03.2026
1. Чтобы, наконец, пришла маршрутка, надо закурить. Если сигарета последняя, маршрутка придет еще до второй затяжки даже вопреки расписанию. 2. Нaдоели зима и снег? Не надо переезжать. Достаточно. . .
Перемещение выделенных строк ТЧ из одного документа в другой
Maks 31.03.2026
Реализация из решения ниже выполнена на примере нетипового документа "ВыдачаОборудованияНаСпецтехнику" с единственной табличной частью "ОборудованиеИКомплектующие" разработанного в конфигурации КА2. . . .
Functional First Web Framework Suave
DevAlt 30.03.2026
Sauve. IO Апнулись до NET10. Из зависимостей один пакет, работает одинаково хорошо как в режиме проекта так и в интерактивном режиме. из сложностей - чисто функциональный подход. Решил. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru