|
0 / 0 / 0
Регистрация: 14.10.2018
Сообщений: 32
|
|
Скачать html страницу (boost.beast)03.01.2019, 17:42. Показов 9141. Ответов 11
Метки нет (Все метки)
Всем доброе время суток, дали задачу реализовать crawler,скачать html страницу необходимо с помощью boost.beast к сожалению потратив очень много времени разобраться в документации этого чуда я не смог, обьясните пожалуйста как скачать html страницу с помощью boost beast
0
|
|
| 03.01.2019, 17:42 | |
|
Ответы с готовыми решениями:
11
boost/regex Поиск ссылок в html-файле
|
|
|
||||||
| 03.01.2019, 18:34 | ||||||
Сообщение было отмечено Peoples как решение
Решение
1
|
||||||
|
0 / 0 / 0
Регистрация: 14.10.2018
Сообщений: 32
|
|
| 03.01.2019, 18:47 [ТС] | |
|
Ты серьезно? спасибо огромное,этот пример я и сам нашел, только я попросил обьяснить как это сделать и как это работает, к тому же я уверен что можно это сделать немного проще, мне так кажется во всяком случае
0
|
|
|
|
|
| 04.01.2019, 11:01 | |
|
Это не пример а код для скачивания https-страницы сайта. Кажется, вопрос был именно в этом. А вот насчёт "можно это сделать немного проще" что то сомнительно.
Да, и OpenSSL должен быть установлен сборка OpenSSL для MSVS2017
0
|
|
|
0 / 0 / 0
Регистрация: 14.10.2018
Сообщений: 32
|
|
| 04.01.2019, 19:33 [ТС] | |
|
да ,извините , вы правы , собрал я это без проблем особы , все работает, потихоньку разбираюсь, у меня к вам еще один вопрос, скажите пожалуйста если задача стоит рекурсивно обойти все ссылки на страницы это тоже нужно использовать boost.beast или что-то другое? вообще с задании нужно использовать boost.beast and gumbo parser ,вот пытаюсь разобраться что для чего
0
|
|
|
|
||||||
| 05.01.2019, 16:28 | ||||||
|
Загружает исходную страницу и выводит в консоль все найденные на ней ссылки. Работает пока только с https-страницами. Парсер - gumbo.
0
|
||||||
|
0 / 0 / 0
Регистрация: 14.10.2018
Сообщений: 32
|
|
| 05.01.2019, 18:14 [ТС] | |
|
igorrr37, спасибо большое)
Добавлено через 45 минут igorrr37, я кстати правильно понимаю что это ассинхронный вариант? начал разбираться в этом более глубоко и как оказалось io_context класс для работы с асинхронными соединениями
0
|
|
|
|
|
| 05.01.2019, 18:34 | |
|
Это синхронный. Для асинхронного надо юзать ф-ции с приставкой async_. Ещё возможен вариант на корутинах.
Добавлено через 2 минуты Вот асинхронный
0
|
|
|
|
||||||
| 06.01.2019, 15:30 | ||||||
|
Добавил глубину обхода и загрузку http-страниц. Работает только с абсолютными ссылками
0
|
||||||
|
0 / 0 / 0
Регистрация: 14.10.2018
Сообщений: 32
|
|
| 07.01.2019, 16:02 [ТС] | |
|
igorrr37, Спасибо.я немного не понгимаю некоторых моментов,зачем в начале вектор строк для 1 ссылки? разве непроще создать просто строку?
0
|
|
|
0 / 0 / 0
Регистрация: 14.10.2018
Сообщений: 32
|
|
| 08.01.2019, 18:31 [ТС] | |
|
igorrr37, скажите,при рекурсивном обходе ссылок с глубиной скажем 2-3 или больше это нормально что одна и таже ссылка встречается несколько раз? я полагаю что в принципе так и должно быть ведь со вспомогательных страниц или каких-то других ресурсов может вести ссылка на главную страницу,да и в целом одна и та жа ссылка может встречаться на нескольких разных ссылках,у меня вопрос,как этого избежать?
0
|
|
|
|
||||||
| 09.01.2019, 15:44 | ||||||
|
Добавил исправление некоторых относительных ссылок в абсолютные, удаление повторяющихся ссылок и учёт тега <base>
0
|
||||||
| 09.01.2019, 15:44 | |
|
Помогаю со студенческими работами здесь
12
Boost asio не хочет возвратить код html при 302 редиректе Как скачать html страницу?
Скачать HTML страницу через Сокеты Скачать html страницу в формате txt Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Налог на собак: https:/ / **********/ gallery/ V06K53e
Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf
Пост отсюда. . .
|
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop?
Ниже её машинный перевод.
После долгих разбирательств я наконец-то вернула себе. . .
|
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод
Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод.
Thinkpad X220 Tablet —. . .
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|