3 / 0 / 0
Регистрация: 08.07.2013
Сообщений: 351
|
|||||||||||
1 | |||||||||||
Скачать HTML страницу через Сокеты31.07.2016, 20:14. Показов 1879. Ответов 5
Метки нет (Все метки)
Всем привет!
Скажите пожалуйста каким образом я могу скачать себе веб-страницу через сокеты? Я устанавливаю соединение с сервером:
P.S. веб-страничка - это любой сайт. Хочу получить его HTML код.
0
|
31.07.2016, 20:14 | |
Ответы с готовыми решениями:
5
Как скачать html страницу? Скачать страницу и сохранить html Скачать html страницу в формате txt Как программно скачать html-страницу? |
Почетный модератор
11525 / 4320 / 448
Регистрация: 12.06.2008
Сообщений: 12,412
|
||||||
31.07.2016, 23:06 | 2 | |||||
Именно.
Например, Код
GET / HTTP/1.0 Host: www.cyberforum.ru Connection: close В общем:
Добавлено через 2 минуты Тут в строке форум зачем-то сам подставляет [url] ко всему, что похоже на ссылку... этих тегов не должно быть в программе. Это просто старый баг форума.
0
|
3 / 0 / 0
Регистрация: 08.07.2013
Сообщений: 351
|
||||||
01.08.2016, 09:35 [ТС] | 3 | |||||
Почитал хабр и смастерил нужный заголовок и стартовую строку... Все сайты на HTTP отдают то что мне нужно, но как только мне нужен доступ к сайту с HTTPS - тут встречаю проблему 302.
Моя строка выглядит так:
Мне нужно получить стартовую страницу... как нужно правильно сформировать строку, чтобы сервер мне отдал страницу?
0
|
Почетный модератор
11525 / 4320 / 448
Регистрация: 12.06.2008
Сообщений: 12,412
|
|
01.08.2016, 20:01 | 4 |
HTTPS использует порт 433, а не 80. И там используется шифрование. Можно использовать OpenSSL для этих целей, но это потребует дополнительного изучения вопроса. Да и можно попробовать использовать сторонние библиотеки, которые позволяют обращаться к HTTP(S)-серверам... например, libcurl. Тогда вам не нужно писать свои клиенты.
Означает, что страница временно находится по другому адресу... и в ответе должно присутствовать поле Location, которое и указывает этот адрес. Но подозреваю, что там будет всё тоже самое, только https вместо http. В общем, предлагаю использовать сторонние библиотеки.
1
|
3 / 0 / 0
Регистрация: 08.07.2013
Сообщений: 351
|
|
02.08.2016, 10:27 [ТС] | 5 |
Спасибо... Только слез с libcurl... хотел через сокеты делать тоже самое) видимо нужно лезть обратно(
0
|
Почетный модератор
11525 / 4320 / 448
Регистрация: 12.06.2008
Сообщений: 12,412
|
|
03.08.2016, 21:10 | 6 |
Можно без него сделать, но для HTTPS тогда потребуется OpenSSL использовать. А если всё равно потребуются внешние библиотеки, тогда проще не городить огород и использовать libcurl или похожие библиотеки.
0
|
03.08.2016, 21:10 | |
03.08.2016, 21:10 | |
Помогаю со студенческими работами здесь
6
Скачать html страницу (boost.beast) Как скачать HTML страницу целиком? Отправка HTML письма через сокеты Скачать страницу через IE Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |