Форум программистов, компьютерный форум, киберфорум
Visual Basic
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.55/11: Рейтинг темы: голосов - 11, средняя оценка - 4.55
1 / 1 / 0
Регистрация: 25.05.2008
Сообщений: 232

Парсинг HTML документа

10.08.2009, 13:29. Показов 2109. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Поделитесь опытом по этой теме.
Может тут MSHTML поможет?
Хотелось бы даже документ в броузер не загружать, просто сделать такой алгоритм, который из ХТМЛ файла вырезал бы указанные теги и сохранял файл.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
10.08.2009, 13:29
Ответы с готовыми решениями:

Парсинг ссылок из HTML документа
Вот такой код нашел на просторах интернета: List links = new List(); foreach (HtmlElement link in webBrowserDocument.Links) { ...

Парсинг списка из html документа
Подскажите пожалуйста. Имеется HTML станичка, в которой есть список из множесмтва элементов (до тысячи) <option value="" ...

Парсинг html документа с js кодом
Здравствуйте, Возникла задача вытащить из кода <script language="JavaScript1.2" type="text/javascript"> qwer=screen1; ...

3
2 / 2 / 1
Регистрация: 19.07.2007
Сообщений: 737
10.08.2009, 13:51
Есть такое понятие как DOM - модель, почитай в MSDN. Там же и примерчики найдешь.
0
 Аватар для palva
4278 / 2970 / 693
Регистрация: 08.06.2007
Сообщений: 9,930
Записей в блоге: 5
10.08.2009, 16:46
Ну, вот пример. Поместите следующий текст в файл с расширением hta и запустите его щелчком мыши. Должна прочитаться страничка и тэг <HTML> со всей внутренностью будет сохранен в файл. Можете написать анализ странички, отбор и обработку нужного вам материала перед сохранением.

<HTML><HEAD>
<META content='text/html; charset=windows-1251' http-equiv=Content-Type>
</HEAD><BODY>
<IFRAME NAME='ifr' ONLOAD='VBSCRIPT: Call sav' WIDTH=0 HEIGHT=0></IFRAME>
<DIV ID='ret'></DIV>
<SCRIPT LANGUAGE=VBSCRIPT>
ifr.location='http://gazeta.ru/'
Sub sav
Set d = ifr.document
i = 1
Do While d.all(i).TagName <> 'HTML'
i = i + 1
Loop
s = d.all(i).outerHTML
Set fso = CreateObject('Scripting.FileSystemObject ')
Set fo = fso.CreateTextFile('out.htm')
fo.WriteLine(s)
fo.close
ret.innerText = 'Готово'
End Sub
</SCRIPT></BODY></HTML>
0
1 / 1 / 0
Регистрация: 25.05.2008
Сообщений: 232
10.08.2009, 16:53  [ТС]
спасибо, попробую
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
10.08.2009, 16:53
Помогаю со студенческими работами здесь

Парсинг Html для установления вида документа
Всем привет!!! Есть локальные файлы в формате html. Их надо распарсить и вытянуть текстовую информацию. Файлы разного...

Парсинг делают одновременно со скачиванием html, или в конце со скачанным html
Представим что html байт за байтом записывается в файл, Как правильнее сделать парсинг , после того как будет скачан полностью весь html,...

Qt парсинг html. Вытащить html код тэга?
QWebElementCollection collection = frame-&gt;findAllElements(&quot;div&quot;); foreach (QWebElement element, collection) { ...

Парсинг HTML, генерация новой HTML страницы
Добрый день. Пишу небольшое расширение для Firefox, используя JS. Общая задача выглядит так: Необходимо сгенерировать...

Защита от удаления элементов HTML кода из документа HTML
В общем нужен скрипт, для защиты от удаления например Div блока из HTML документа. Например если Div блок удален, то скрипт выводит...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20%
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
Горе от ума
kumehtar 07.04.2026
Эта мне ментальная установка, что вот прямо сейчас, мол, мне для полного счастья не хватает (нужное вписать), и когда я этого достигну - тогда и полный кайф. Одна из самых сильных ловушек на пути. . . .
Использование значений реквизитов справочника в документе, с определенными условиями и правами
Maks 07.04.2026
1. Контроль срока действия договора Алгоритм из решения ниже реализован на примере нетипового документа "ЗаявкаНаРаботу", разработанного в конфигурации КА2. Задача: уведомлять пользователя, если. . .
Доступность команды формы по условию
Maks 07.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: сделать доступной кнопку (команда формы "ЗавершитьСписание") при. . .
Уведомление о неверно выбранном значении справочника
Maks 06.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "НарядПутевка", разработанного в конфигурации КА2. Задача: уведомлять пользователя, если в документе выбран неверный склад. . .
Установка Qt Creator для C и C++: ставим среду, CMake и MinGW без фреймворка Qt
8Observer8 05.04.2026
Среду разработки Qt Creator можно установить без фреймворка Qt. Есть отдельный репозиторий для этой среды: https:/ / github. com/ qt-creator/ qt-creator, где можно скачать установщик, на вкладке Releases:. . .
AkelPad-скрипты, структуры, и немного лирики..
testuser2 05.04.2026
Такая программа, как AkelPad существует уже давно, и также давно существуют скрипты под нее. Тем не менее, прога живет, периодически что-то не спеша дополняется, улучшается. Что меня в первую очередь. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru