Форум программистов, компьютерный форум, киберфорум
C++: Сети
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.63/16: Рейтинг темы: голосов - 16, средняя оценка - 4.63
 Аватар для tomaticus
51 / 51 / 5
Регистрация: 02.01.2011
Сообщений: 503

Сохранение исходного кода страницы путем http

18.06.2012, 21:02. Показов 3244. Ответов 14
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Сразу к коду :
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
    if (hInternet != NULL) {
        // открываем HTTP сессию
        HINTERNET hConnect = 
            ::InternetConnect(
                hInternet,
                TEXT("www.cyberforum.ru"),
                INTERNET_DEFAULT_HTTP_PORT,
                NULL,NULL,
                INTERNET_SERVICE_HTTP,
                0,
                1u);
 
        if (hConnect != NULL) {
            // открываем запрос
            HINTERNET hRequest = 
                ::HttpOpenRequest(
                    hConnect,
                    TEXT(""),
                    TEXT("/cpp-beginners/"),
                    NULL,
                    NULL,
                    0,
                    INTERNET_FLAG_KEEP_CONNECTION,
                    1);
 
            if (hRequest != NULL) {
                // посылаем запрос
                BOOL bSend = ::HttpSendRequest(hRequest, NULL,0, NULL,0);
                if (bSend) {
                    // создаём выходной файл
                    ofstream fnews("news.html",ios::out|ios::binary);
                    if (fnews.is_open()) for (;;) {
                        // читаем данные
                        char  szData[1024];
                        DWORD dwBytesRead;
                        BOOL bRead = 
                            ::InternetReadFile(
                                hRequest,
                                szData,sizeof(szData)-1,
                                &dwBytesRead);
 
                        // выход из цикла при ошибке или завершении
                        if (bRead == FALSE  ||  dwBytesRead == 0)
                            break;
 
                        // сохраняем результат
                        szData[dwBytesRead] = 0;
                        fnews << szData;
                        
                        ok = true;
                    }
                }
                // закрываем запрос
                ::InternetCloseHandle(hRequest);
            }
            // закрываем сессию
            ::InternetCloseHandle(hConnect);
        }
        // закрываем WinInet
        ::InternetCloseHandle(hInternet);
    }
 
    // для полного счастья, запускаем считанную страничку
    if (ok)
    {
                cout << "\nsucsess!" << endl;
        system("start news.html");
    }
    else
    {
        cout << "fail" << endl;
    }
Данным кодом, мы переходим на страницу www.cyberforum.ru/cpp-beginners/, и сохраняем все содержимое в файл, после его открываем, и видим - все работает.
Как, путем минимального изменения кода, сделать тоже самое, только чтобы в файле хранился исходный код. Например сайт vk.com по определенном запросе возвращает это :
XML
1
2
3
<response list="true">
  <uid>14251135</uid>
</response>
Мне нужно сохранить это в файл, после чего с этим работать.
Спасибо.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
18.06.2012, 21:02
Ответы с готовыми решениями:

Сохранение текста со страницы путем http
Вообщем. Есть страница в интернете, где содержится строк 20-25 текста, в виде xml. Мне надо весь текст скопировать, и сохранить в...

IE не всегда открывает страницы, показывает что-то наподобие исходного кода страницы
Всех приветствую! У меня вчера какая-то беда приключилась на компе. Возможно вирус навредил. Опишу по порядку, как всё происходило. ...

Нормальное сохранение исходного кода
Здрасте. Вопрос собственно вот в чем: сохраняю страницу в хтмл, а весь код в одну строку. Как сделать из него нормальную древовидную...

14
Эксперт С++
516 / 421 / 92
Регистрация: 23.09.2010
Сообщений: 1,165
18.06.2012, 22:08
Почитайте про Ajax. Ваша задача скорее всего гораздо сложнее, чем вы думаете.
0
 Аватар для tomaticus
51 / 51 / 5
Регистрация: 02.01.2011
Сообщений: 503
18.06.2012, 22:28  [ТС]
Цитата Сообщение от gooseim Посмотреть сообщение
Ваша задача скорее всего гораздо сложнее, чем вы думаете.
хм, если уж я составил http запрос, и открыл всю страницу, то как-то легко можно узнать исходный текст. ИМХО.
0
Эксперт С++
516 / 421 / 92
Регистрация: 23.09.2010
Сообщений: 1,165
18.06.2012, 22:30
tomaticus, html-код может генерироваться динамически, а не статически.
0
 Аватар для tomaticus
51 / 51 / 5
Регистрация: 02.01.2011
Сообщений: 503
19.06.2012, 19:17  [ТС]
Ну так решения нет, как я понял?
0
0 / 0 / 0
Регистрация: 19.06.2012
Сообщений: 22
19.06.2012, 19:42
Нету решения =((
0
Эксперт С++
 Аватар для Avazart
8488 / 6155 / 615
Регистрация: 10.12.2010
Сообщений: 28,683
Записей в блоге: 30
19.06.2012, 19:49
У меня получилось получить страничку с таким кодом с помощью boost::asio
(код взят отсюда Считать исходный код интернет страницы)
HTML5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Frameset//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-frameset.dtd">
<html lang="en" xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>vc.com</title>
<link rel="shortcut icon" href="/static/template/qing/images/qing.ico" type="image/x-icon" />
</head>
<frameset cols="1,*" border="0" frameborder="0" framespacing="0">
  <frame name="hftop" src="/top.php?d=vc.com" scrolling="no" frameborder="0" marginwidth="0" marginheight="0" noresize="noresize" />
  <frame name="hfdisplay" src="/landing.php?d=vc.com" scrolling="auto" frameborder="0" marginwidth="0" marginheight="0" noresize="noresize" />
<noframes>
<body>
<p>This page requires frames</p>
</body>
</noframes>
</frameset>
</html>
Но я так и не понял что именно требуется?
0
 Аватар для tomaticus
51 / 51 / 5
Регистрация: 02.01.2011
Сообщений: 503
19.06.2012, 21:38  [ТС]
Avazart, требуется сохранить весь текст с сайта.
0
Эксперт С++
 Аватар для Avazart
8488 / 6155 / 615
Регистрация: 10.12.2010
Сообщений: 28,683
Записей в блоге: 30
19.06.2012, 22:29
Весь текст сайта или весь текст html-страницы?
0
 Аватар для xADMIRALx
70 / 64 / 5
Регистрация: 09.06.2012
Сообщений: 291
20.06.2012, 05:03
Я так понял требутся сохранить HTML-страницу в переменную а затем через регулярные выражения работать с переменной..

Кто знает как это сделать ?
0
Эксперт С++
 Аватар для Avazart
8488 / 6155 / 615
Регистрация: 10.12.2010
Сообщений: 28,683
Записей в блоге: 30
20.06.2012, 17:00
xADMIRALx, я же ссылку кинул...
А парсить можно вручную, а можно с помощью boost/regex
0
 Аватар для tomaticus
51 / 51 / 5
Регистрация: 02.01.2011
Сообщений: 503
20.06.2012, 21:24  [ТС]
при определенном запросе, сайт возвращает только xml текст. мне нужно весь этот текст сохранить в переменную.
0
Эксперт С++
 Аватар для Avazart
8488 / 6155 / 615
Регистрация: 10.12.2010
Сообщений: 28,683
Записей в блоге: 30
20.06.2012, 21:52
Нифига не понял...
tomaticus, при чем тут xml ?

Я ранеее приводил:
HTML5
1
2
3
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Frameset//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-frameset.dtd">
<html lang="en" xmlns="http://www.w3.org/1999/xhtml">
...
Где вы видете здесь xml когда заголовок html-евский?
0
 Аватар для Aneron
166 / 164 / 27
Регистрация: 20.04.2010
Сообщений: 607
26.06.2012, 22:02
1. Любым способом конектишься к серверу. Например через самые обычные сокеты(connect() и т.д.)
2. Посылаешь http запрос по данному конекту. В случае сокета(send()). главное - структура запроса. Не забудь нужные символы. Иначе сервер не поймет.
3. Получаешь заголовок http ответа. Сотчитываешь оттуда величину данных (Content-Lenght).
4. Получаешь нужное число данных. Записываешь их в файл. Данные http ответа - и есть html страница. Нех изобретать велосипед.
5. Если есть авторизация на сайте,то нужным запросом проавторизуйся. Советую сначала просмотреть какие запросы и ответы посылает браузер,когда сидит на данном сайте.
0
 Аватар для tomaticus
51 / 51 / 5
Регистрация: 02.01.2011
Сообщений: 503
28.06.2012, 12:35  [ТС]
Aneron, я привел код. как из этого кода сохранить в переменную данные сайта?
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
28.06.2012, 12:35
Помогаю со студенческими работами здесь

Изменение исходного кода страницы
Привет! я хочу сделать такую программу чтобы она позволяла менять код html через код элемента )

Загрузка исходного кода страницы
Я думаю все знают, что можно в браузере просматривать исходный код. Правой кнопкой мыши по странице, в контекстном меню выбрать...

Граббинг исходного кода страницы
Пишу нечто типа RSS читалки. Делаю класс, унаследованный от ListBox: конструктор: public MatchDates() { ...

Просмотр исходного кода страницы
Возможно ли узнать, просматривает ли пользователь исходный код страницы, черз php

Получение исходного кода страницы
При получении исходного кода нету половины результата, пришел к выводу что данные подгружаются JavaScript, с помощью какой библиотеки или...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
15
Ответ Создать тему
Новые блоги и статьи
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие. Ссылка в Linux — это дополнительная запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая. . .
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора ВВЕДЕНИЕ Выполняя задание на управление насосной группой заполнения резервуара,. . .
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru