|
1 / 1 / 0
Регистрация: 25.05.2008
Сообщений: 232
|
|
Парсинг HTML документа10.08.2009, 13:29. Показов 2085. Ответов 3
Метки нет (Все метки)
Поделитесь опытом по этой теме.
Может тут MSHTML поможет? Хотелось бы даже документ в броузер не загружать, просто сделать такой алгоритм, который из ХТМЛ файла вырезал бы указанные теги и сохранял файл.
0
|
|
| 10.08.2009, 13:29 | |
|
Ответы с готовыми решениями:
3
Парсинг ссылок из HTML документа Парсинг списка из html документа Парсинг html документа с js кодом |
|
2 / 2 / 1
Регистрация: 19.07.2007
Сообщений: 737
|
|
| 10.08.2009, 13:51 | |
|
Есть такое понятие как DOM - модель, почитай в MSDN. Там же и примерчики найдешь.
0
|
|
|
|
|
| 10.08.2009, 16:46 | |
|
Ну, вот пример. Поместите следующий текст в файл с расширением hta и запустите его щелчком мыши. Должна прочитаться страничка и тэг <HTML> со всей внутренностью будет сохранен в файл. Можете написать анализ странички, отбор и обработку нужного вам материала перед сохранением.
<HTML><HEAD> <META content='text/html; charset=windows-1251' http-equiv=Content-Type> </HEAD><BODY> <IFRAME NAME='ifr' ONLOAD='VBSCRIPT: Call sav' WIDTH=0 HEIGHT=0></IFRAME> <DIV ID='ret'></DIV> <SCRIPT LANGUAGE=VBSCRIPT> ifr.location='http://gazeta.ru/' Sub sav Set d = ifr.document i = 1 Do While d.all(i).TagName <> 'HTML' i = i + 1 Loop s = d.all(i).outerHTML Set fso = CreateObject('Scripting.FileSystemObject ') Set fo = fso.CreateTextFile('out.htm') fo.WriteLine(s) fo.close ret.innerText = 'Готово' End Sub </SCRIPT></BODY></HTML>
0
|
|
|
1 / 1 / 0
Регистрация: 25.05.2008
Сообщений: 232
|
|
| 10.08.2009, 16:53 [ТС] | |
|
спасибо, попробую
0
|
|
| 10.08.2009, 16:53 | |
|
Помогаю со студенческими работами здесь
4
Парсинг Html для установления вида документа Парсинг делают одновременно со скачиванием html, или в конце со скачанным html Qt парсинг html. Вытащить html код тэга? Парсинг HTML, генерация новой HTML страницы Защита от удаления элементов HTML кода из документа HTML Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
моя боль
iceja 24.01.2026
Выложила интерполяцию кубическими сплайнами www. iceja. net
REST сервисы временно не работают, только через Web.
Написала за 56 рабочих часов этот сайт с нуля. При помощи perplexity. ai PRO , при. . .
|
Модель сукцессии микоризы
anaschu 24.01.2026
Решили писать научную статью с неким РОманом
|
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
|
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма).
На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
|
|
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ *
Дана цепь(не выше 3-го порядка) постоянного тока с элементами R, L, C, k(ключ), U, E, J. Программа находит переходные токи
и напряжения на элементах схемы классическим методом(1 и 2 з-ны. . .
|
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым.
Но восстановить их можно так.
Для этого понадобится консольная утилита. . .
|
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
|
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11
— это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
|