Форум программистов, компьютерный форум CyberForum.ru

Как получить данные с html страницы - C++

Восстановить пароль Регистрация
 
dzrkot
zzzZZZ...
 Аватар для dzrkot
516 / 346 / 53
Регистрация: 11.09.2013
Сообщений: 1,977
08.09.2014, 08:17     Как получить данные с html страницы #1
Всегда интересовало, как к примеру пишут ботов для вк, или скрипты какие-нибудь для сайцтов итп, но механизм взаимодействия я не понимаю - т.к. к примеру как узнать ту или иную инфу с html страницы - это надо создавать сокет http, и потом из html страницы парсить?
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
Renji
1535 / 983 / 240
Регистрация: 05.06.2014
Сообщений: 2,963
08.09.2014, 09:04     Как получить данные с html страницы #2
Взять готовую библиотеку по скачиванию страничек (скажем, curl), натравить на эти странички регулярные выражения и в итоге переписать программу на Перле.
Perl 6
1
2
3
4
use utf8;
use LWP::Simple;
print "заголовок страницы ya.ru - $1" if get("http://ya.ru/")=~/<title>(.*?)<\/title>/;
<>;
dzrkot
zzzZZZ...
 Аватар для dzrkot
516 / 346 / 53
Регистрация: 11.09.2013
Сообщений: 1,977
08.09.2014, 09:07  [ТС]     Как получить данные с html страницы #3
Цитата Сообщение от Renji Посмотреть сообщение
Взять готовую библиотеку по скачиванию страничек (скажем, curl), натравить на эти странички регулярные выражения и в итоге переписать программу на Перле.
1) учить новый язык не хочу
2) я ничего такого писать не собирался
3) меня интересовал сам механизм ...
Renji
1535 / 983 / 240
Регистрация: 05.06.2014
Сообщений: 2,963
08.09.2014, 09:10     Как получить данные с html страницы #4
Ну так механизм и сводится к "скачать страницу, пройтись регуляркой". Если интересует низкоуровневая реализация скачивания, то курить стандарт на HTTP протокол.
DrOffset
08.09.2014, 09:28
  #5

Не по теме:

Цитата Сообщение от dzrkot Посмотреть сообщение
учить новый язык не хочу
Новый язык учить не предлагалось. Это такой тонкий юмор (на тему гвоздей, микроскопов и вообще применимости инструментов).

dzrkot
zzzZZZ...
 Аватар для dzrkot
516 / 346 / 53
Регистрация: 11.09.2013
Сообщений: 1,977
08.09.2014, 09:58  [ТС]     Как получить данные с html страницы #6
Цитата Сообщение от DrOffset Посмотреть сообщение
Новый язык учить не предлагалось. Это такой тонкий юмор (на тему гвоздей, микроскопов и вообще применимости инструментов).
вы поаккуратней, а то я такой, я ведь могу))
oazis
Заблокирован
08.09.2014, 10:45     Как получить данные с html страницы #7
как к примеру пишут ботов для вк
Боты для сайтов обычно основаны на GET- и POST-запросах.
Почитайте и разберитесь что это такое.

скрипты какие-нибудь для сайцтов итп
Иногда пишут расширения к браузерам.
Это приложения, позволяющие, например, изменять код страниц при их открытии в браузере, делать редиректы и т.д.
Но их пишут на JS, а не на C++. На C++ только к IE.
krv
71 / 51 / 11
Регистрация: 10.07.2014
Сообщений: 328
08.09.2014, 11:09     Как получить данные с html страницы #8
Можно сокеты. Это муторно ибо низкоуровнево, но мощно.
Можно библиотеки.
Уже упомянули curl
Я например использую InDy
Есть еще хорошая - synapse но у нее проблемы с СиБилдером, а если на Делфи - лучше всего.
Так же есть незаслуженно забытая (асинхронная!) Fundamentals

Если уж совсем высокий уровень - можно использовать TCppWebBrowser но он на dll от ИЕ
Есть Cromium - но опять же он для Делфи лучше.

Я перепробовал это все - кроме курла.
Остановился на Инди.
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
08.09.2014, 11:28     Как получить данные с html страницы
Еще ссылки по теме:

Библиотека/утилита для извления flv (флэш) контента из html страницы C++
Как получить исходные данные из 10-й строки файла? C++
Получение html кода страницы C++

Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
oazis
Заблокирован
08.09.2014, 11:28     Как получить данные с html страницы #9
Из браузерных движков еще Awesomium есть. Под .NET довольно удобен, про натив хз.
Yandex
Объявления
08.09.2014, 11:28     Как получить данные с html страницы
Ответ Создать тему
Опции темы

Текущее время: 18:14. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2016, vBulletin Solutions, Inc.
Рейтинг@Mail.ru