Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
 Аватар для supmener
87 / 95 / 15
Регистрация: 26.06.2013
Сообщений: 4,755

Не могу разобраться с wget (wget2)

08.09.2025, 22:12. Показов 814. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Хочу составить команду, которая скачает начальный сайт целиком и внешние страницы, на которые ведут ссылки из первоначального сайта только (но с картинками, CSS, JS файлами), без перехода с них (страниц вторичных сайтов) уже на другие страницы, указанных на них.
Встречал описания флагов:
- -p, --page-requisites: скачивает всё, что нужно для корректного отображения HTML-страницы (картинки, CSS и т. п.). Работает с -r.
- -r, --recursive: рекурсивное скачивание.
- -l N, --level=N: ограничение глубины рекурсии до N уровней. -l 1 значит только начальная страница и её ссылки на уровне 1.
- -H, --span-hosts: разрешает переходить на внешние хосты во время рекурсии. Не ограничивает количеством уровней сам по себе.
- -E, --adjust-extension: корректирует расширения сохраняемых файлов (например, сохранять HTML как .html). Не конфликтует напрямую с остальными, но влияет на имена файлов.

Но не понял, как это правильно использовать для поставленной задачи, так как для начального сайта получается, что нужны одни настройки, а для тех, на которые ведут ссылки с него, уже нужны другие настройки.
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
08.09.2025, 22:12
Ответы с готовыми решениями:

Загрузка файлов из интернета. Wget
Есть список ссылок на файлы расположенные в интернете. Нужно их загрузить. Решение известно -...

Установка модуля wget
Всем привет! Хотел установить модуль wget, но не получилось, устанавливая его через pip выдавало...

Какая разница между библиотеками wget и requests?
Какая разница между библиотеками wget и requests?

1
2903 / 1937 / 210
Регистрация: 05.06.2011
Сообщений: 5,715
09.09.2025, 12:53
Разве что использовать --rejected-log вкупе с запретом уходить с сайта, потом разобрать его и извлечь оттуда список дополнительных ссылок, на кои натравить wget уже с другими параметрами... Сомневаюсь, что хоть wget, хоть curl умеют одной строкой выразить столь изощрённые критерии.
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
09.09.2025, 12:53
Помогаю со студенческими работами здесь

Pycharm. Работа с библиотекой wget в Python
Ребят, всем привет! Возник вопрос по работе модуля(библиотеки) wget с использованием среды Pycharm....

Не могу разобраться в работе модуля rarfile на винде
Приветствую! Проблема такая - на лине скрипт нормально отрабатывает, а вот когда запускаю его на...

unhashable type - не могу разобраться
Вот собственно часть задачи. При запуске выводится отчет об ошибке. Помогите найти как исправить...

Не могу разобраться с удаленной отправкой
Добрый день. Создал скрипт на питоне - он берет через определенное время команды из файла на...

Не могу разобраться с sys.path
Здравствуйте! Начал изучение по книге Лутца, в ней сказано “А пока, чтобы избежать осложнений,...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Как я обхитрил таблицу Word
Alexander-7 21.03.2026
Когда мигает курсор у внешнего края таблицы, и нам надо перейти на новую строку, а при нажатии Enter создается новый ряд таблицы с ячейками, то мы вместо нервных нажатий Энтеров мы пишем любые буквы. . .
Krabik - рыболовный бот для WoW 3.3.5a
AmbA 21.03.2026
без регистрации и смс. Это не торговля, приложение не содержит рекламы. Выполняет свою непосредственную задачу - автоматизацию рыбалки в WoW - и ничего более. Однако если админы будут против -. . .
Программный отбор значений справочника
Maks 21.03.2026
Установка программного отбора значений справочника "Сотрудники" из модуля формы документа. В качестве фильтра для отбора служит предопределенное значение перечислений. Процедура. . .
Переходник USB-CAN-GPIO
Eddy_Em 20.03.2026
Достаточно давно на работе возникла необходимость в переходнике CAN-USB с гальваноразвязкой, оный и был разработан. Однако, все меня терзала совесть, что аж 48-ногий МК используется так тупо: просто. . .
Оттенки серого
Argus19 18.03.2026
Оттенки серого Нашёл в интернете 3 прекрасных модуля: Модуль класса открытия диалога открытия/ сохранения файла на Win32 API; Модуль класса быстрого перекодирования цветного изображения в оттенки. . .
SDL3 для Desktop (MinGW): Рисуем цветные прямоугольники с помощью рисовальщика SDL3 на Си и C++
8Observer8 17.03.2026
Содержание блога Финальные проекты на Си и на C++: finish-rectangles-sdl3-c. zip finish-rectangles-sdl3-cpp. zip
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие. Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора ВВЕДЕНИЕ Выполняя задание на управление насосной группой заполнения резервуара,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru