|
0 / 0 / 0
Регистрация: 13.09.2015
Сообщений: 2
|
||||||
Регулярные выражение, вывод предложений26.10.2018, 23:07. Показов 6212. Ответов 3
Метки регулярные выражения (Все метки)
Всем привет!
Новичок в Питоне и в текстовом анализе. Нуждаюсь в помощи: из текстового файла считывается русский текст. Необходимо разбить текст на предложения и вывести их. С этим я справилась:
0
|
||||||
| 26.10.2018, 23:07 | |
|
Ответы с готовыми решениями:
3
Вывод предложений |
|
1303 / 843 / 409
Регистрация: 12.03.2018
Сообщений: 2,305
|
|
| 27.10.2018, 00:44 | |
|
\n - переход на новую строку. Добавить его в один из символов в []
0
|
|
|
|
|||||||||||||||||||||||||||
| 27.10.2018, 02:37 | |||||||||||||||||||||||||||
|
(И зачем там вертикальная черта в регэкспе? Этот символ внутри квадратных скобок интерпретируется буквально.) Не пишите велосипедов - сегментация предложений исключительно сложная задача текстпроцессинга и пока не существует механизмов для такой сегментации, работающих со 100% точностью (статистичеcкие и rule-based анализаторы дают ~95%). Из готовых инструментов на Python более-менее приемлемую точность сегментации текста на предложения показывает модуль segtok. Он тоже работает на регулярных выражениях, но только они на порядок сложнее, чем вы себе можете представить. Если же перед вам стоит чисто учебная задача и вы хотите обойтись ручной работой - используйте
Сравните.
предложение с пропущенной точкой и, например, это: Природа жаждущих степей Его в день гнева породила, И зелень мертвую ветвей И корни ядом напоила. где с Новой строки и с Заглавной буквы все еще продолжается тоже самое предложение?
0
|
|||||||||||||||||||||||||||
|
0 / 0 / 0
Регистрация: 13.09.2015
Сообщений: 2
|
|||
| 27.10.2018, 16:05 [ТС] | |||
|
Но спасибо за ответ!
0
|
|||
| 27.10.2018, 16:05 | |
|
Помогаю со студенческими работами здесь
4
Регулярные выражения: поиск английских предложений среди русских Регулярные выражение Регулярные выражения: разделение предложений по точке и пробелу
Регулярные выражение Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога
Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
|
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
|
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога
В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
|
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 31.01.2026
Содержание блога
Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
|
|
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога
Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
|
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
|
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования.
Часть библиотеки BedvitCOM
Использованы. . .
|
SDL3 для Android: Загрузка PNG с альфа-каналом с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога
SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
|