Форум программистов, компьютерный форум CyberForum.ru

Парсинг и обход дерева - C++

Войти
Регистрация
Восстановить пароль
 
Nikto
 Аватар для Nikto
138 / 120 / 34
Регистрация: 28.11.2009
Сообщений: 356
Записей в блоге: 10
16.07.2016, 21:47     Парсинг и обход дерева #1
С помощью библиотеки htmlcxx парсится веб страничка. На выходе получаю DOM дерево. Ладно бы была одна страничка, тогда написал функцию для обхода, так страничек много и для каждой писать функцию для обхода с соответствующим поиском тегов и атрибутов это ж ппц как не охото.
На шарпе юзал AngleSharp с его QuerySelectorAll, писал QuerySelectorAll("tr td:nth-child(1) a") и получал все нужные элементы. Пытался найти библиотеки с похожим функционалом для C++, но гугл ничего толкового не выдал, все они дают в результате дерево.
Кто-нибудь знает способ универсального обхода дерева с заданием входных данных как у QuerySelectorAll?
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
16.07.2016, 21:47     Парсинг и обход дерева
Посмотрите здесь:

C++ Обход произвольного дерева
Обход дерева C++
Обход небинарного дерева Visual C++
C++ Нерекурсивный обход дерева
Обход дерева) C++
Обход дерева C++
обход дерева C++
C++ Обход дерева Хаффмана
Обход дерева по образцу C++
C++ обход дерева
C++ Ускорить обход дерева
C++ Обход Бинарного дерева

Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
rao
 Аватар для rao
447 / 310 / 90
Регистрация: 02.04.2014
Сообщений: 922
17.07.2016, 10:47     Парсинг и обход дерева #2
Не знаю что такое QuerySelectorAll, поэтому может быть ляпну не в тему. Есть такая штука как MSXML. Она умеет работать с содержимым на языке запросов XPath.
Nikto
 Аватар для Nikto
138 / 120 / 34
Регистрация: 28.11.2009
Сообщений: 356
Записей в блоге: 10
17.07.2016, 12:48  [ТС]     Парсинг и обход дерева #3
rao, смущает приставка MS, эта штука только под винду?

Добавлено через 19 минут
Нашёл такую штуку http://hcxselect.sourceforge.net/doc...p-example.html
Пока буду разбираться с ней. Если кто знает хороший c++ парсер с возможностью сделать запрос css selector или xpath, то отпишитись, потому как htmlcxx что-то барахлит.
Dmitriy_M
1307 / 1188 / 109
Регистрация: 20.03.2009
Сообщений: 4,262
Записей в блоге: 11
18.07.2016, 11:50     Парсинг и обход дерева #4
Я вот такую штуку сделал вокруг Gumbo.
Yandex
Объявления
18.07.2016, 11:50     Парсинг и обход дерева
Ответ Создать тему
Опции темы

Текущее время: 04:57. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru