|
0 / 0 / 0
Регистрация: 20.05.2017
Сообщений: 8
|
|
Автоматическое разбиение текста на предложения в русском языке20.05.2017, 20:24. Показов 4284. Ответов 4
Метки нет (Все метки)
0
|
|
| 20.05.2017, 20:24 | |
|
Ответы с готовыми решениями:
4
Ввод предложения на русском языке Дан текстовый файл Т, содержащий предложения на русском языке. Дано предложение на русском языке. Построить список слов предложения |
|
|
|
| 20.05.2017, 22:28 | |
|
Как вам помочь, если вы еще ничего не написали?
Если вам это нужно для реальной задачи - используйте готовые сегментаторы, типа sent_tokenize из пакета nltk. Если для чего-то другого - для начала начните хоть что-то писать. Подход с помощью статистики требует знание статистики. В nltk это реализовано регулярными выражениями: не всегда точно, но для многих случаев подойдет.
0
|
|
|
0 / 0 / 0
Регистрация: 20.05.2017
Сообщений: 8
|
|
| 21.05.2017, 05:03 [ТС] | |
|
в python я разбираюсь очень плохо, а делать надо. Программа нужна для сдачи экзамена. Понадеялась, что кто-то поделиться своими знаниями и подскажет хотя бы алгоритм.
0
|
|
|
Просто Лис
|
||||||
| 21.05.2017, 11:59 | ||||||
0
|
||||||
|
|
||||||
| 21.05.2017, 14:06 | ||||||
|
Это неправильный в общем случае вариант. Он оставляет пустые строки и удаляет знаки терминирующие предложение.
Если уж пользоваться примитивами разбивки, то так:
Добавлено через 8 минут И, как я уже указал, есть nltk, где сегментация текста на предложения реализована на очень высоком уровне, хотя она и недостаточно точная в сравнении с методами сегментации основанными на статистич. подходах. Добавлено через 27 минут irinamiass2212, Насчет nltk я немного ошибся - авторы более ответственно подошли к задаче и реализовали подход не на голых регулярках, а применили более сложный алгоритм с подсчетом частотных характеристик и грамматическими эвристиками. source
0
|
||||||
| 21.05.2017, 14:06 | |
|
Помогаю со студенческими работами здесь
5
Вывод текста на русском языке
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Оттенки серого
Argus19 18.03.2026
Оттенки серого
Нашёл в интернете 3 прекрасных модуля:
Модуль класса открытия диалога открытия/ сохранения файла на Win32 API;
Модуль класса быстрого перекодирования цветного изображения в оттенки. . .
|
SDL3 для Desktop (MinGW): Рисуем цветные прямоугольники с помощью рисовальщика SDL3 на Си и C++
8Observer8 17.03.2026
Содержание блога
Финальные проекты на Си и на C++:
finish-rectangles-sdl3-c. zip
finish-rectangles-sdl3-cpp. zip
|
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие.
Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
|
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ВВЕДЕНИЕ
Выполняя задание на управление насосной группой заполнения резервуара,. . .
|
|
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
|
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога
Финальные проекты на Си и на C++:
hello-sdl3-c. zip
hello-sdl3-cpp. zip
Результат:
|
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога
MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
|
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд.
Даже если у вас. . .
|