Парсер HTML01.01.2011, 09:47. Показов 21609. Ответов 35
Метки нет (Все метки)
Здравствуйте! Нигде не могу найти парсера HTML на Си/С++, помогите кто чем может!
На PHP все просто выходит в две строки, но надо именно на С++ для реализации многопоточности Например такая строка
На пхп все реализуется в две строки:
1
|
|||||||||||
| 01.01.2011, 09:47 | |
|
Ответы с готовыми решениями:
35
Вопрос про Парсер HTML с помощью Indy
HTML Парсер |
|
8 / 7 / 0
Регистрация: 22.06.2010
Сообщений: 96
|
||||||
| 05.01.2011, 15:07 | ||||||
|
Вот, моя зарисовочка. Парсит все гиперлинки, но пока она не идеальна:
Если у кого есть готовый парсер, пожалуйста выложите, тоже нужно!
1
|
||||||
|
|
|
| 05.01.2011, 16:31 | |
|
Есть специальные библиотеки для работы с регулярными выражениями. Что-то есть в составе Boost. В своей программе все коды по парсингу страниц я вынес в отдельные Lua-скрипты (чтобы не затаскивать в бинарник то, что по сути от меня не зависит)
1
|
|
|
8 / 7 / 0
Регистрация: 22.06.2010
Сообщений: 96
|
|
| 05.01.2011, 16:55 | |
|
1
|
|
|
|
|
| 05.01.2011, 17:32 | |
|
1
|
|
|
|
|
| 05.01.2011, 17:40 | |
|
2
|
|
|
3956 / 1811 / 184
Регистрация: 21.11.2009
Сообщений: 2,540
|
||||||
| 05.01.2011, 17:43 | ||||||
|
pascyber1, вспомнил, когда-то давно использовал регулярные выражения для получения данных с погодного сайта...
Вот вам пример, часть кода этой программы:
1
|
||||||
|
8 / 7 / 0
Регистрация: 22.06.2010
Сообщений: 96
|
|
| 05.01.2011, 18:05 | |
|
MikeSoft, спасибо, но палец можно сломать. Не-а, это не мой уровень. Мне бы попроще. Но, я так понимаю, готового парсера нет ни у кого. Прийдётся ломать голову самому.
1
|
|
|
|
|||
| 05.01.2011, 18:10 | |||
|
1
|
|||
|
8 / 7 / 0
Регистрация: 22.06.2010
Сообщений: 96
|
|||||||
| 05.01.2011, 18:23 | |||||||
1
|
|||||||
|
83 / 18 / 2
Регистрация: 17.11.2010
Сообщений: 107
|
||
| 05.01.2011, 18:34 | ||
|
Максимум что я нарыл так это посимвольная "маска". В принципе, более менее хоть какая-то регулярка если нужно именно на c++
1
|
||
|
3956 / 1811 / 184
Регистрация: 21.11.2009
Сообщений: 2,540
|
|||||||
| 05.01.2011, 21:56 | |||||||
|
Программирование, на самом деле, не такая уж и лёгкая штука, как кажется. Вы добавляете на форму кнопку и всего лишь описываете поведение на событие щелчка. А вы задумывались, что нужно сделать, чтобы создать саму форму, которая ещё и способна принимать сообщение от системы? Знакомы с WinAPI? Попробуйте создать новый проект: File -> New -> Console Application. Затем уберите галочку с пунктов Use VCL и с Console Application. А затем вставьте следующий код и откомпилируйте:
2
|
|||||||
| 07.01.2011, 18:04 [ТС] | |||||||||||
|
Вот посоветовали использовать токенайзер
http://cpp.pastebin.com/1iLixmbC
никто не подскажет как его добавить к моей программе??
0
|
|||||||||||
|
83 / 18 / 2
Регистрация: 17.11.2010
Сообщений: 107
|
|
| 07.01.2011, 19:44 | |
|
1
|
|
|
|
|
| 20.02.2011, 23:36 | |
|
а где, собственно, то, что есть ? объединять-то нечего пока...
0
|
|
| 27.02.2011, 13:06 [ТС] | |
|
Решаем программы, пишем собственные модули и функции продолжение темы
0
|
|
|
145 / 100 / 6
Регистрация: 11.03.2010
Сообщений: 477
|
||||||
| 04.03.2011, 11:40 | ||||||
|
я тут попробовал переделать приведенный пример кода для своих целей
Парсер HTML вышло вот такое дело:
[Name] == Heavygloves && [Quality] == Unique [Name] == ChainGloves && [Quality] == Unique [Name] == LightGauntlets && [Quality] == Unique [Name] == OgreGauntlets && [Quality] == Unique [Name] == VampireboneGloves && [Quality] == Unique отсеивать все то что находится в [] скобках. вобщем то работает нормально но только до первой скобки. и результат выводит в виде [Name как можно его заставить сканить весь текст ? и выводить все встречающиеся комбинации?
0
|
||||||
| 04.03.2011, 11:40 | |
|
Помогаю со студенческими работами здесь
20
Html парсер на QT Парсер html Парсер HTML на C++ Html парсер Парсер html на c++ Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Налог на собак: https:/ / **********/ gallery/ V06K53e
Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf
Пост отсюда. . .
|
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop?
Ниже её машинный перевод.
После долгих разбирательств я наконец-то вернула себе. . .
|
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод
Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод.
Thinkpad X220 Tablet —. . .
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|