Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.50/6: Рейтинг темы: голосов - 6, средняя оценка - 4.50
25 / 25 / 6
Регистрация: 26.09.2010
Сообщений: 295

Парсинг Html для установления вида документа

22.03.2012, 15:42. Показов 1266. Ответов 4
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Всем привет!!! Есть локальные файлы в формате html. Их надо распарсить и вытянуть текстовую информацию. Файлы разного типа(УКАЗ,РАСПОРЯЖЕНИЕ,ПРИКАЗ). Нужно чтобы программа распознавала типы файлов. ТО есть брала из текста тип и совершала дальнейшие действия. Как это сделать?
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
22.03.2012, 15:42
Ответы с готовыми решениями:

Парсинг html документа с js кодом
Здравствуйте, Возникла задача вытащить из кода <script language="JavaScript1.2" type="text/javascript"> qwer=screen1; ...

Парсинг списка из html документа
Подскажите пожалуйста. Имеется HTML станичка, в которой есть список из множесмтва элементов (до тысячи) <option value="" ...

Парсинг ссылок из HTML документа
Вот такой код нашел на просторах интернета: List links = new List(); foreach (HtmlElement link in webBrowserDocument.Links) { ...

4
 Аватар для Монфрид
1245 / 1055 / 293
Регистрация: 07.03.2012
Сообщений: 3,246
22.03.2012, 15:44
воспользоваться библиотекой htmlAgilityPack, либо парсить вручную (indexOf,substring), или регулярные выражения
0
 Аватар для Masia_March
70 / 70 / 12
Регистрация: 09.08.2011
Сообщений: 116
Записей в блоге: 1
22.03.2012, 17:38
С распознаванием типа файла просто, в этом поможет OpenFileDialog там настроишь фильтры, а в своем алгоритме скажешь
C#
1
2
3
4
5
6
7
switch(TypeFile)//(УКАЗ,РАСПОРЯЖЕНИЕ,ПРИКАЗ)
case "УКАЗ":
...// метод обработки файла с типом УКАЗ
break;
case "РАСПОРЯЖЕНИЕ":
...// метод обработки файла с типом УКАЗ
и так далее
с парсером довольно сложнее. Тут ищи готовые .dll или свое пиши.
1
25 / 25 / 6
Регистрация: 26.09.2010
Сообщений: 295
23.03.2012, 11:48  [ТС]
Цитата Сообщение от Монфрид Посмотреть сообщение
воспользоваться библиотекой htmlAgilityPack, либо парсить вручную (indexOf,substring), или регулярные выражения
А как подружить indexOf с htmlAgilityPack?

Добавлено через 2 часа 5 минут
Сам и отвечаю
C#
1
2
3
4
5
6
7
8
9
 if(doc.DocumentNode.InnerText.IndexOf("искомая строка")>0)
{
 
 
}
else
{
 
}
1
774 / 554 / 80
Регистрация: 03.07.2011
Сообщений: 1,020
23.03.2012, 12:36
Цитата Сообщение от SoloWay Посмотреть сообщение
C#
1
if(doc.DocumentNode.InnerText.IndexOf("искомая строка")>0)
У искомой строки начальный индекс может так же быть и нуль ,поэтому надо писать >-1
C#
1
if(doc.DocumentNode.InnerText.IndexOf("искомая строка")>-1)
или воспользоваться методом Contains
C#
1
if(doc.DocumentNode.InnerText.Contains("искомая строка"))
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
23.03.2012, 12:36
Помогаю со студенческими работами здесь

Парсинг HTML документа
Поделитесь опытом по этой теме. Может тут MSHTML поможет? Хотелось бы даже документ в броузер не загружать, просто сделать такой...

Создать форму настройки внешнего вида HTML документа:
Помогите пожалуйста разобраться с задачей: Для html страницы создать форму настройки внешнего вида HTML-документа с помощью которой...

Парсинг html файла для поиска ссылок
Добрий день. Стоит задача найти и пропарсить html файлы в фолдере. Найти понятно как. А вот как их пропарсить? Смысл в том, что я...

Загрузка html и его парсинг для отображения в WebView
подскажите пожалуйста как вытащить определенный div из загруженной страницы, только скажите пожалуйста как еще загрузить эту страницу....

Какие правила прописать в конфигах сервера? (для файлов вида index.html?p=1)
ссылки вида /catalog/namecat/?p=1 файл расположен /catalog/namecat/index.html?p=1 т.е. имя файла: index.html?p=1 Какие правила...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие. Ссылка в Linux — это дополнительная запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая. . .
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора ВВЕДЕНИЕ Выполняя задание на управление насосной группой заполнения резервуара,. . .
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru