Форум программистов, компьютерный форум CyberForum.ru

Парсер HTML страниц - C++

Восстановить пароль Регистрация
 
YouCanStopMe
 Аватар для YouCanStopMe
0 / 0 / 0
Регистрация: 09.02.2014
Сообщений: 6
04.05.2014, 02:17     Парсер HTML страниц #1
Здравствуйте,

Начал учить C++, интересует информация, исходник парсера HTML страницы. Очень был бы благодарен такой информацией

Добавлено через 11 минут
Хочу попробовать, для начала разобратся с парсером. Или с чего, советуете начать?
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
04.05.2014, 02:17     Парсер HTML страниц
Посмотрите здесь:

C++ Парсер HTML на C++
C++ Парсер
C++ Сохранение страниц сайтов в формате html
Парсер HTML C++
c++ парсер html страниц C++
C++ Правила вложенности тегов html (html разметка на С++)
C++ Перевести обычный файл в HTML, добавив соответствующие HTML-теги
C++ Парсер

Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
d01
2 / 2 / 1
Регистрация: 10.01.2014
Сообщений: 37
04.05.2014, 14:24     Парсер HTML страниц #2
YouCanStopMe, дело в том что универсального парсера по сути не существует, для каждого сайта, нужно писать свой, т.к верстка html страниц отличается, равно как и задачи парсинга на определенных страницах сайта.. Для того чтобы написать парсер, вам нужно достаточно уверенное владение языком, знание и умение применять регулярные выражения, для работы с ними в плюсах, есть специальные библиотеки..
Поэтому, если вы только начали изучать С++, то задачу вы для себя выбрали не простую, скорее всего такое изучение, превратится для вас в мучение и в скором времени вы все это благополучно забросите) Помню, лет так 7-8 назад, я искал работу веб-программистом, и тестовым заданием у меня было написать парсер, времени давалось на это день.. Писать нужно было на PHP, к слову сказать, там подобная задача решается, "в пару строк", так вот, тогда я столкнулся еще с огромной кучей подводных камней, таких как бан по ip, за нещадное кол-во запросов и скорость перебора страниц, и мн. др, пришлось решать это с помощью прокси и разных других уловок, но это уже совсем другая история..) Это я все к тому, что для написания парсера вам потребуется знание языка, но более глубокое понимание работы веб серверов..
YouCanStopMe
 Аватар для YouCanStopMe
0 / 0 / 0
Регистрация: 09.02.2014
Сообщений: 6
04.05.2014, 14:56  [ТС]     Парсер HTML страниц #3
d01, большое спасибо за совет.
Yandex
Объявления
04.05.2014, 14:56     Парсер HTML страниц
Ответ Создать тему
Опции темы

Текущее время: 22:32. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2016, vBulletin Solutions, Inc.
Рейтинг@Mail.ru