Форум программистов, компьютерный форум, киберфорум
Visual Basic
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.55/11: Рейтинг темы: голосов - 11, средняя оценка - 4.55
1 / 1 / 0
Регистрация: 25.05.2008
Сообщений: 232

Парсинг HTML документа

10.08.2009, 13:29. Показов 2085. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Поделитесь опытом по этой теме.
Может тут MSHTML поможет?
Хотелось бы даже документ в броузер не загружать, просто сделать такой алгоритм, который из ХТМЛ файла вырезал бы указанные теги и сохранял файл.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
10.08.2009, 13:29
Ответы с готовыми решениями:

Парсинг ссылок из HTML документа
Вот такой код нашел на просторах интернета: List links = new List(); foreach (HtmlElement link in webBrowserDocument.Links) { ...

Парсинг списка из html документа
Подскажите пожалуйста. Имеется HTML станичка, в которой есть список из множесмтва элементов (до тысячи) <option value="" ...

Парсинг html документа с js кодом
Здравствуйте, Возникла задача вытащить из кода <script language="JavaScript1.2" type="text/javascript"> qwer=screen1; ...

3
2 / 2 / 1
Регистрация: 19.07.2007
Сообщений: 737
10.08.2009, 13:51
Есть такое понятие как DOM - модель, почитай в MSDN. Там же и примерчики найдешь.
0
 Аватар для palva
4278 / 2970 / 693
Регистрация: 08.06.2007
Сообщений: 9,927
Записей в блоге: 5
10.08.2009, 16:46
Ну, вот пример. Поместите следующий текст в файл с расширением hta и запустите его щелчком мыши. Должна прочитаться страничка и тэг <HTML> со всей внутренностью будет сохранен в файл. Можете написать анализ странички, отбор и обработку нужного вам материала перед сохранением.

<HTML><HEAD>
<META content='text/html; charset=windows-1251' http-equiv=Content-Type>
</HEAD><BODY>
<IFRAME NAME='ifr' ONLOAD='VBSCRIPT: Call sav' WIDTH=0 HEIGHT=0></IFRAME>
<DIV ID='ret'></DIV>
<SCRIPT LANGUAGE=VBSCRIPT>
ifr.location='http://gazeta.ru/'
Sub sav
Set d = ifr.document
i = 1
Do While d.all(i).TagName <> 'HTML'
i = i + 1
Loop
s = d.all(i).outerHTML
Set fso = CreateObject('Scripting.FileSystemObject ')
Set fo = fso.CreateTextFile('out.htm')
fo.WriteLine(s)
fo.close
ret.innerText = 'Готово'
End Sub
</SCRIPT></BODY></HTML>
0
1 / 1 / 0
Регистрация: 25.05.2008
Сообщений: 232
10.08.2009, 16:53  [ТС]
спасибо, попробую
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
10.08.2009, 16:53
Помогаю со студенческими работами здесь

Парсинг Html для установления вида документа
Всем привет!!! Есть локальные файлы в формате html. Их надо распарсить и вытянуть текстовую информацию. Файлы разного...

Парсинг делают одновременно со скачиванием html, или в конце со скачанным html
Представим что html байт за байтом записывается в файл, Как правильнее сделать парсинг , после того как будет скачан полностью весь html,...

Qt парсинг html. Вытащить html код тэга?
QWebElementCollection collection = frame-&gt;findAllElements(&quot;div&quot;); foreach (QWebElement element, collection) { ...

Парсинг HTML, генерация новой HTML страницы
Добрый день. Пишу небольшое расширение для Firefox, используя JS. Общая задача выглядит так: Необходимо сгенерировать...

Защита от удаления элементов HTML кода из документа HTML
В общем нужен скрипт, для защиты от удаления например Div блока из HTML документа. Например если Div блок удален, то скрипт выводит...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
моя боль
iceja 24.01.2026
Выложила интерполяцию кубическими сплайнами www. iceja. net REST сервисы временно не работают, только через Web. Написала за 56 рабочих часов этот сайт с нуля. При помощи perplexity. ai PRO , при. . .
Модель сукцессии микоризы
anaschu 24.01.2026
Решили писать научную статью с неким РОманом
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь(не выше 3-го порядка) постоянного тока с элементами R, L, C, k(ключ), U, E, J. Программа находит переходные токи и напряжения на элементах схемы классическим методом(1 и 2 з-ны. . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru