Форум программистов, компьютерный форум, киберфорум
C# для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.57/7: Рейтинг темы: голосов - 7, средняя оценка - 4.57
1 / 1 / 3
Регистрация: 10.03.2018
Сообщений: 150

Регулярные выражения - поиск в html

18.05.2018, 16:48. Показов 1551. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый день.
Есть html документ.
Как выбрать часть текста?
Допустим:
Текст находится посредине.
1. Начинается он с <div class="branch-cont">
2. Далее есть пробелы и перенос строки.
3. Далее есть <div class="branch-item">
4. Далее много текста.
5. Далее <div class="branch-group">

Регулярное выражение
<div class="branch-cont">(\s|\n)+<div class="branch-item">(?!(<div class="branch-group">))(<div class="branch-group">)
не работает.
Если оставить рег. выражение
<div class="branch-cont">(\s|\n)+<div class="branch-item">
То до 3 пункта все нормально отрабатывает.

Подскажите как дойти до 5 пункта?
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
18.05.2018, 16:48
Ответы с готовыми решениями:

Регулярные выражения, спецсимволы html
Добрый день, прошу Вас подсказать Как можно с помощью регулярных выражений описать спецсимволы html &amp;nbsp; и тому подобные? Я...

Регулярные выражения для парсинга HTML
Как можно заменить такое: .Replace(&quot;&lt;font color=\&quot;White\&quot;&gt;&quot;, &quot;&quot;) .Replace(&quot;&lt;font color=\&quot;Olive\&quot;&gt;&quot;, &quot;&quot;) .Replace(&quot;&lt;font...

Регулярные выражения: удаление html-тегов
Как с помощью регулярных выражений избавиться от вывода в текст HTML-тегов? т.е. в программу на данном этапе выводится текст типа...

3
 Аватар для Shogun31337
557 / 534 / 225
Регистрация: 02.11.2016
Сообщений: 1,538
18.05.2018, 18:35
Цитата Сообщение от kmvcf Посмотреть сообщение
Есть html документ.
Как выбрать часть текста?
HtmlDocument не проще будет использовать, чем регулярки?
0
Администратор
Эксперт .NET
 Аватар для OwenGlendower
18294 / 14218 / 5368
Регистрация: 17.03.2014
Сообщений: 28,896
Записей в блоге: 1
18.05.2018, 18:44
kmvcf, первое - выбрасываем идею с регулярным выражением. Второе - берем одну из библиотек предназначенных для разбора html - HtmlAgilityPack или AngleSharp. С их помощью это делается гораздо проще. Например, в AngleSharp
C#
1
2
var branchGroup = doc.QuerySelector("div.branch-cont div.branch-item div.branch-group");
string text = branchGroup.TextContent;
0
1 / 1 / 3
Регистрация: 10.03.2018
Сообщений: 150
18.05.2018, 20:24  [ТС]
Спасибо.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
18.05.2018, 20:24
Помогаю со студенческими работами здесь

Регулярные выражения для парсинга HTML
Допустим скачал HTML страницу. Внутри ее кучи строк и мне нужно вырезать все , что находится между : &lt;p...

Парсинг HTML через регулярные выражения
Помогите с помощью регулярного выражения вытянуть 3 значения из HTML документа.

Парсинг HTML через регулярные выражения
Здравствуйте, есть исходник html странички. Мне нужно вытащить из неё все нужные мне строки. Допустим: &lt;li...

Регулярные выражения - некорректно парсится HTML-страница
Здравствуйте,битый день пытаюсь понять почему не работает выражение.Есть html файл, нужно вытащить текст из body. pattern =...

Регулярные выражения (найти нужный кусок в HTML коде)
Всем привет. В последнем теге дата, как мне её выцепить? Помогите пожалуйста. Заранее спасибо. &lt;tr id=&quot;tr-3995560&quot;&gt;...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11680&amp;d=1772460536 Одним из. . .
Реалии
Hrethgir 01.03.2026
Нет, я не закончил до сих пор симулятор. Эта задача сложнее. Не получилось уйти в плавсостав, но оно и к лучшему, возможно. Точнее получалось - но сварщиком в палубную команду, а это значит, в моём. . .
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
SDL3 для Web (WebAssembly): Сборка библиотек: SDL3, Box2D, FreeType, SDL3_ttf, SDL3_mixer и SDL3_image из исходников с помощью CMake и Emscripten
8Observer8 27.02.2026
Недавно вышла версия 3. 4. 2 библиотеки SDL3. На странице официальной релиза доступны исходники, готовые DLL (для x86, x64, arm64), а также библиотеки для разработки под Android, MinGW и Visual Studio. . . .
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование . \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json> Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом. # Check if. . .
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так: https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347 Основана на STM32F303RBT6. На борту пять. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru