Форум программистов, компьютерный форум CyberForum.ru

Как сохранить страницу сайта - C++

Восстановить пароль Регистрация
 
mrKurt
0 / 0 / 0
Регистрация: 13.03.2014
Сообщений: 2
13.03.2014, 02:03     Как сохранить страницу сайта #1
Сказали, что "Открытый банк заданий ЕГЭ" на сайте ФИПИ закроют в конце марта, а готовиться то надо, поэтому решил сохранить задания. Ручками работать сразу перехотелось, потому что слишком много рутинной работы. Воспользовался методом С++ URLDownloadToFile, но вместо страницы с заданиями в файле было "Ошибка: Пользователь не определен". Открыл страницу с заданиями в другом браузере получил ту же самую ошибку. Пройдя путь с главной страницы сайта до банка заданий ошибка перестала вылетать, а открылись задания, значит дело в кукис? Можно ли передать средствами С++?
Пробывал закосить под браузер сменой user-agent(через WinInet) ничего не вышло.
Хотел найти в каком виде и где хранятся файлы, но не вышло, знаю, только их урл
http://www.fipi.ru/os11/xmodules/qpr...no=4&groupno=0 (это пример)
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
Fene4ka_
84 / 84 / 16
Регистрация: 24.01.2014
Сообщений: 1,142
13.03.2014, 04:29     Как сохранить страницу сайта #2
mrKurt, а скачать страничку нажатием правой кнопки на странице - сохранить как ?
mrKurt
0 / 0 / 0
Регистрация: 13.03.2014
Сообщений: 2
13.03.2014, 08:54  [ТС]     Как сохранить страницу сайта #3
Цитата Сообщение от Fene4ka_ Посмотреть сообщение
а скачать страничку нажатием правой кнопки на странице - сохранить как ?
дак я же написал, там в разделах допустим по обществознанию более пятисот страниц, ручками очень медленно будет

Добавлено через 15 минут
только если и это автоматизировать, жаль что php не владею, буду пытаться на юзерскриптах реализовать
dimcoder
Полярный
 Аватар для dimcoder
449 / 422 / 66
Регистрация: 11.09.2011
Сообщений: 1,108
13.03.2014, 10:16     Как сохранить страницу сайта #4
Цитата Сообщение от mrKurt Посмотреть сообщение
только если и это автоматизировать, жаль что php не владею, буду пытаться на юзерскриптах реализовать
Если еще интересно, у меня батник сохранился, я через него сайт кое какой качал на 800 страниц. Там страницы по порядку шли от 1 до 800. На сайте фипи просматривается структура http://www.fipi.ru/view/sections/%i%/docs/ где i - номер страницы. Попробуйте, может получится чего:
Код
@echo off
SET /a i=1

:loop
IF %i%==822 GOTO END
echo This is iteration %i%.
C:\wget.exe -p -E http://www.fipi.ru/view/sections/%i%/docs/ -P C:\Sites\
SET /a i=%i%+1
GOTO LOOP

:end
echo That’s it!
ЗЫ Код надо вставить в текстовик и сохранить под типом .bat
А еще wget надо будет скачать и поместить в диск С: для примера выше.

А там уже попроще будет когда все скачаете. А если еще какой нибудь паттерн найдете, то вообще замечательно.
Yandex
Объявления
13.03.2014, 10:16     Как сохранить страницу сайта
Ответ Создать тему
Опции темы

Текущее время: 10:49. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2016, vBulletin Solutions, Inc.
Рейтинг@Mail.ru