Форум программистов, компьютерный форум CyberForum.ru
Наши страницы

HTML Parser - C++

Войти
Регистрация
Восстановить пароль
Другие темы раздела
C++ Алгоритм передвижения монстров в игре http://www.cyberforum.ru/cpp-beginners/thread336840.html
Доброго времени суток и спасибо ,что ,по крайней мере, обратили внимание на сообщение:yahoo: Итак проблема вот в чем заключаеться - делаю игру... все написал - алгоритм движения монстров(спасибо...
C++ Динамика, динамика и снова динамика Вот как сделать например, что бы динамический массив например int **pArray = new int*; for(int i = 0; i < rows; i++) pArray = new int; Объявлялся еще в одном for-е и на каждой последующей... http://www.cyberforum.ru/cpp-beginners/thread336833.html
C++ С чего начать изучение C++
Добрый день всем! Я хотел бы получить совет об изучении языка (С++), теперь немного предыстории. Я учусь в колледже на последнем курсе на оператора ЭВМ, но кроме начальных знаний html и составлении...
Нахождение площади через координаты треугольника C++
Здравствуйте, есть задание Напишите функцию square, вычисляющую площадь треугольника. С ее помощью для каждой из N точек определите, принадлежит ли точка заданному треугольнику. Входные...
C++ Абстрактный класс чисел http://www.cyberforum.ru/cpp-beginners/thread336728.html
Нужно создать абстрактный класс чисел с виртуальными методами - арифметическими операциями. У этого класса 2 наследника - комплексные числа и дроби. Я написал решение этой задачи, но оно мне...
C++ Рекурсия в различных компиляторах Доброго времени суток. Задача: дано целое число n, нужно получить его битовое представление, развернуть его, и то, что получилось перевести обратно в десятичную систему счисления. Пример:n = 4,... подробнее

Показать сообщение отдельно
Lindemann66
4 / 4 / 0
Регистрация: 28.04.2010
Сообщений: 162

HTML Parser - C++

28.07.2011, 13:29. Просмотров 2216. Ответов 5
Метки (Все метки)

Всем привет!

Необходимо написать parser содержимого html - в частности, тэгов

Лично я в основу положил обычный проход по html, с поиском начального символа тэга <, определения типа тэга и считывания его содержимого до следующего открывающего, либо закрывающего тэга

Плюс, необходимо учитывать вложенность тэгов
То есть, если ситуация
HTML5
1
<div>текст1 <a>текст2</a> текст3</div>
то в результате должно получиться
div : текст 1 текст2 текст3
div, a : текст 2
a сохраняется, так как у него тип - inside (сам придумал), тк, если не приписывать содержимое тэга а в тэг div, может потеряться смысл содержимого тэга div

Вобщем-то, алгоритм почти реализован, но ситуация с вложенностью в нём обрабатывается плохо...

Может, у кого-то будут какие-то свежие идеи на счёт такого parser'а html?
Буду благодарен за любой ответ!
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
 
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru