|
0 / 0 / 0
Регистрация: 06.05.2011
Сообщений: 6
|
|||||||||||
Поиск регулярным выражением фрагмента текста с пустой строкой06.05.2011, 11:41. Показов 2791. Ответов 9
Метки нет (Все метки)
Столкнулся со следующей проблемой: есть книга в виде HTML, в которой главы представлены так:
Где подводный камень? Спасибо
0
|
|||||||||||
| 06.05.2011, 11:41 | |
|
Ответы с готовыми решениями:
9
Поиск регулярным выражением
Поиск регулярным выражением единственного соответствия |
|
4 / 4 / 0
Регистрация: 31.01.2010
Сообщений: 27
|
|||||||
| 06.05.2011, 12:04 | |||||||
0
|
|||||||
|
0 / 0 / 0
Регистрация: 06.05.2011
Сообщений: 6
|
|||||||||||
| 06.05.2011, 12:42 [ТС] | |||||||||||
|
Спасибо! У меня есть похожий вариант:
0
|
|||||||||||
|
4 / 4 / 0
Регистрация: 31.01.2010
Сообщений: 27
|
||||||
| 06.05.2011, 15:40 | ||||||
|
Да, в 12 строке.
0
|
||||||
|
0 / 0 / 0
Регистрация: 06.05.2011
Сообщений: 6
|
||
| 06.05.2011, 15:54 [ТС] | ||
|
0
|
||
|
4 / 4 / 0
Регистрация: 31.01.2010
Сообщений: 27
|
||||||
| 06.05.2011, 17:40 | ||||||
|
Дайте исходный файл, который парсить надо; так будет легче регулярку протестить. Ибо на том куске, что был дан, она отрабатывает.
Только что протестил на таком коде и выдало искомую строку.
0
|
||||||
|
0 / 0 / 0
Регистрация: 06.05.2011
Сообщений: 6
|
|
| 06.05.2011, 20:11 [ТС] | |
|
Исходный файл, собственно, ничем от примера не отличается. Только вместо "название главы" идет реальное название главы, а дальше идет текст главы между <p> и </p>. Прицепил в аттач один такой файл.
Регулярка работает, я ее оттелистил отдельно. Похоже проблема в том, что когда я читаю файл при помощи Stream.Reader, я каждый раз загоняю в переменную data новую строку, а не набор строк, внутри которых регулярка ищет совпадения. То есть, сначала я прочитал <h2>Глава 1</h2>, затем прочитал пустую строку, затем прочитал <div class='chapter_title'>Название главы</div>. Естественно, что в каждой из этих строк регулярка ничего не находит. Вопрос, на который я не могу ответить: как читать файл так, чтобы этот поиск работал? Чтобы регулярнкой анализировался массив строк?
0
|
|
|
гроза ленивых студентов
456 / 411 / 51
Регистрация: 27.03.2011
Сообщений: 823
|
|
| 06.05.2011, 20:12 | |
|
0
|
|
|
4 / 4 / 0
Регистрация: 31.01.2010
Сообщений: 27
|
|
| 06.05.2011, 22:27 | |
|
Тьфу ты, и правда, построчно вычитываешь. А если дёшего и сердито - сразу reader.ReadToEnd() ? Дальше там же парсишь регуляркой, заменяешь - и в streamwriter.
0
|
|
|
гроза ленивых студентов
456 / 411 / 51
Регистрация: 27.03.2011
Сообщений: 823
|
|||
| 06.05.2011, 22:29 | |||
|
0
|
|||
| 06.05.2011, 22:29 | |
|
Помогаю со студенческими работами здесь
10
Извлечь цифры из текста после определённых символов регулярным выражением Поиск соответствия содержания текстового поля с регулярным выражением не абсолютно Обработка считывания текста из файла с завершающей пустой строкой с регулярным выражением. Запутался с регулярным выражением Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ВВЕДЕНИЕ
Выполняя задание на управление насосной группой заполнения резервуара,. . .
|
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
|
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога
Финальные проекты на Си и на C++:
hello-sdl3-c. zip
hello-sdl3-cpp. zip
Результат:
|
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога
MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
|
|
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд.
Даже если у вас. . .
|
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает
монорепозиторий в котором находятся все исходники.
При создании нового решения, мы просто добавляем нужные проекты
и имеем. . .
|
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение:
В этой книге («Подход, основанный на вариантах использования») Ивар утверждает,
что архитектура программного обеспечения — это
структуры,. . .
|
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога
Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
|