1 / 1 / 0
Регистрация: 25.05.2008
Сообщений: 232
|
|
1 | |
Парсинг HTML документа10.08.2009, 13:29. Показов 1968. Ответов 3
Метки нет (Все метки)
Поделитесь опытом по этой теме.
Может тут MSHTML поможет? Хотелось бы даже документ в броузер не загружать, просто сделать такой алгоритм, который из ХТМЛ файла вырезал бы указанные теги и сохранял файл.
0
|
10.08.2009, 13:29 | |
Ответы с готовыми решениями:
3
Парсинг ссылок из HTML документа Парсинг списка из html документа Парсинг html документа с js кодом Парсинг Html для установления вида документа |
2 / 2 / 1
Регистрация: 19.07.2007
Сообщений: 737
|
|
10.08.2009, 13:51 | 2 |
Есть такое понятие как DOM - модель, почитай в MSDN. Там же и примерчики найдешь.
0
|
10.08.2009, 16:46 | 3 |
Ну, вот пример. Поместите следующий текст в файл с расширением hta и запустите его щелчком мыши. Должна прочитаться страничка и тэг <HTML> со всей внутренностью будет сохранен в файл. Можете написать анализ странички, отбор и обработку нужного вам материала перед сохранением.
<HTML><HEAD> <META content='text/html; charset=windows-1251' http-equiv=Content-Type> </HEAD><BODY> <IFRAME NAME='ifr' ONLOAD='VBSCRIPT: Call sav' WIDTH=0 HEIGHT=0></IFRAME> <DIV ID='ret'></DIV> <SCRIPT LANGUAGE=VBSCRIPT> ifr.location='http://gazeta.ru/' Sub sav Set d = ifr.document i = 1 Do While d.all(i).TagName <> 'HTML' i = i + 1 Loop s = d.all(i).outerHTML Set fso = CreateObject('Scripting.FileSystemObject') Set fo = fso.CreateTextFile('out.htm') fo.WriteLine(s) fo.close ret.innerText = 'Готово' End Sub </SCRIPT></BODY></HTML>
0
|
1 / 1 / 0
Регистрация: 25.05.2008
Сообщений: 232
|
|
10.08.2009, 16:53 [ТС] | 4 |
спасибо, попробую
0
|
10.08.2009, 16:53 | |
10.08.2009, 16:53 | |
Помогаю со студенческими работами здесь
4
Парсинг делают одновременно со скачиванием html, или в конце со скачанным html Qt парсинг html. Вытащить html код тэга? Парсинг HTML, генерация новой HTML страницы Защита от удаления элементов HTML кода из документа HTML Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |