1 / 1 / 0
Регистрация: 25.05.2008
Сообщений: 232
1

Парсинг HTML документа

10.08.2009, 13:29. Показов 1968. Ответов 3
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Поделитесь опытом по этой теме.
Может тут MSHTML поможет?
Хотелось бы даже документ в броузер не загружать, просто сделать такой алгоритм, который из ХТМЛ файла вырезал бы указанные теги и сохранял файл.
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
10.08.2009, 13:29
Ответы с готовыми решениями:

Парсинг ссылок из HTML документа
Вот такой код нашел на просторах интернета: List links = new List(); foreach (HtmlElement link in...

Парсинг списка из html документа
Подскажите пожалуйста. Имеется HTML станичка, в которой есть список из множесмтва элементов (до...

Парсинг html документа с js кодом
Здравствуйте, Возникла задача вытащить из кода <script language="JavaScript1.2"...

Парсинг Html для установления вида документа
Всем привет!!! Есть локальные файлы в формате html. Их надо распарсить и вытянуть текстовую...

3
2 / 2 / 1
Регистрация: 19.07.2007
Сообщений: 737
10.08.2009, 13:51 2
Есть такое понятие как DOM - модель, почитай в MSDN. Там же и примерчики найдешь.
0
4240 / 2937 / 687
Регистрация: 08.06.2007
Сообщений: 9,816
Записей в блоге: 4
10.08.2009, 16:46 3
Ну, вот пример. Поместите следующий текст в файл с расширением hta и запустите его щелчком мыши. Должна прочитаться страничка и тэг <HTML> со всей внутренностью будет сохранен в файл. Можете написать анализ странички, отбор и обработку нужного вам материала перед сохранением.

<HTML><HEAD>
<META content='text/html; charset=windows-1251' http-equiv=Content-Type>
</HEAD><BODY>
<IFRAME NAME='ifr' ONLOAD='VBSCRIPT: Call sav' WIDTH=0 HEIGHT=0></IFRAME>
<DIV ID='ret'></DIV>
<SCRIPT LANGUAGE=VBSCRIPT>
ifr.location='http://gazeta.ru/'
Sub sav
Set d = ifr.document
i = 1
Do While d.all(i).TagName <> 'HTML'
i = i + 1
Loop
s = d.all(i).outerHTML
Set fso = CreateObject('Scripting.FileSystemObject')
Set fo = fso.CreateTextFile('out.htm')
fo.WriteLine(s)
fo.close
ret.innerText = 'Готово'
End Sub
</SCRIPT></BODY></HTML>
0
1 / 1 / 0
Регистрация: 25.05.2008
Сообщений: 232
10.08.2009, 16:53  [ТС] 4
спасибо, попробую
0
10.08.2009, 16:53
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
10.08.2009, 16:53
Помогаю со студенческими работами здесь

Парсинг делают одновременно со скачиванием html, или в конце со скачанным html
Представим что html байт за байтом записывается в файл, Как правильнее сделать парсинг , после того...

Qt парсинг html. Вытащить html код тэга?
QWebElementCollection collection = frame-&gt;findAllElements(&quot;div&quot;); foreach (QWebElement...

Парсинг HTML, генерация новой HTML страницы
Добрый день. Пишу небольшое расширение для Firefox, используя JS. Общая задача выглядит так:...

Защита от удаления элементов HTML кода из документа HTML
В общем нужен скрипт, для защиты от удаления например Div блока из HTML документа. Например если...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru