Форум программистов, компьютерный форум, киберфорум
C++ Builder
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.77/13: Рейтинг темы: голосов - 13, средняя оценка - 4.77
 Аватар для kess
0 / 0 / 0
Регистрация: 08.12.2008
Сообщений: 27

HTML парсинг

10.12.2008, 00:24. Показов 2746. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Вот такая задачка:
Надо вытаскивать/писать данные из/в ХТМЛ.

По сути моя задача написать анализатор строк для файла ХТМЛ или тут более сложный процесс и я чего то не догнал??

З.Ы. Я не прошу писать за меня код просто нужен адекватный совет.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
10.12.2008, 00:24
Ответы с готовыми решениями:

Парсинг HTML
В компоненте WebBrowser загружается страница, нужно сделать так, чтобы программа находила нужный элемент для ввода (по классу или id) и...

Парсинг HTML страницы
Всем доброго дня. Кто делал парсинг HTML стриницы с помощью CppWebBrowser и OleObject. Как считать загруженную страницу из CppWebBrowser в...

Парсинг html страницы
Доброго времени суток! Мне нужно сделать парсинг html страницы из WWW. Подскажите пожалуйста, как организовать загрузку страницы для...

2
 Аватар для GalaX
701 / 573 / 59
Регистрация: 18.11.2008
Сообщений: 2,147
10.12.2008, 09:16
незнаю в си есть ли какиенить модули для работы с HTML/XML, но парсинг можно проводить через регулярные выражения
0
 Аватар для oxotnik
1665 / 1134 / 80
Регистрация: 21.08.2008
Сообщений: 4,734
Записей в блоге: 1
10.12.2008, 09:40
Цитата Сообщение от kess Посмотреть сообщение
Вот такая задачка:
Надо вытаскивать/писать данные из/в ХТМЛ.

По сути моя задача написать анализатор строк для файла ХТМЛ или тут более сложный процесс и я чего то не догнал??

З.Ы. Я не прошу писать за меня код просто нужен адекватный совет.
Смотри в МСДНе в сторону DOM: IHTMLDocument, IHTMLElement и т.п.

примерный код:
Code
1
2
3
4
5
6
IHTMLDocument *pDoc;
CppWebBrowser1->Document->QueryInterface(IID_IHTMLDocument, (void**)&pDoc);
IHTMLElement *pBody;
pDoc->get_Body(&pBody);
BSTR htmlText;
pBody->get_html(&htmlText);
элемент pBody может состоять из подэлементов как то: таблицы, списки, элементы форматирования и пр.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
10.12.2008, 09:40
Помогаю со студенческими работами здесь

парсинг HTML из Builder C++
У меня вознила проблема, мне нужно получать данные с сайта, а именно допустим информацию о изделиях (картина+описание) , чтобы решить эту...

Удалить теги из текста (парсинг html)
И снова доброго времени суток дорогие программисты! Опишу суть вопроса: через функцию:...

Парсинг делают одновременно со скачиванием html, или в конце со скачанным html
Представим что html байт за байтом записывается в файл, Как правильнее сделать парсинг , после того как будет скачан полностью весь html,...

Qt парсинг html. Вытащить html код тэга?
QWebElementCollection collection = frame->findAllElements("div"); foreach (QWebElement element, collection) { ...

Парсинг HTML, генерация новой HTML страницы
Добрый день. Пишу небольшое расширение для Firefox, используя JS. Общая задача выглядит так: Необходимо сгенерировать...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
SDL3 для Web (WebAssembly): Сборка библиотек SDL3 и Box2D из исходников с помощью CMake и Emscripten
8Observer8 27.02.2026
Недавно вышла версия SDL 3. 4. 2 библиотеки SDL3. На странице официальной релиза доступны исходники, готовые DLL (для x86, x64, arm64), а также библиотеки для разработки под Android, MinGW и Visual. . .
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование . \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json> Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом. # Check if. . .
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так: https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347 Основана на STM32F303RBT6. На борту пять. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru