Форум программистов, компьютерный форум, киберфорум
Python: Научные вычисления
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.93/29: Рейтинг темы: голосов - 29, средняя оценка - 4.93
0 / 0 / 0
Регистрация: 12.02.2020
Сообщений: 4

NLTK для обработки русского текста и другие библиотеки

13.11.2021, 14:47. Показов 6591. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Насколько хорошо nltk обрабатывает русский текст и какие библиотеки стоит подучить что лучше работать с русским текстом?
Заранее спасибо за уделенное время
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
13.11.2021, 14:47
Ответы с готовыми решениями:

Ищу работающие библиотеки для парсинга русского языка
Всё что что сложнее pymorphy2 - либо уже не поддерживается, либо выдает ошибки.. Что сейчас актуально для python 3+?

Вводится произвольная строка русского текста, а также одна из букв русского алфавита. Удвоить эту букву в строке
Вводится произвольная строка русского текста, а также одна из букв русского алфавита. Удвоить эту букву в строке.

Как посмотреть какие библиотеки тянут другие библиотеки процесса
Привет, есть процесс, у него подтянуты dll'ки список которых я могу просматривать прогой Process Explorer. НО вопрос как посмотреть...

2
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
13.11.2021, 15:45
Лучший ответ Сообщение было отмечено 01zhas как решение

Решение

Цитата Сообщение от 01zhas Посмотреть сообщение
Насколько хорошо nltk обрабатывает русский текст
Что конкретно нужно?
NLTK практически не имеет моделей для русского языка.
Что-то можно прикручивать от сторонних разработчиков, но в зависимости от конкретной задачи лучше смотреть в сторону библиотек заточенных сразу под русский язык: pymorphy2 (только морфоанализ: POS tagger + inflection engine for Russian and Ukrainian languages) и стек библиотек natasha (там дофига всего, пока на полную конкуренцию с nltk все-таки не тянет, но это реально мощный проект для русскоязычного сектора NLP).
1
0 / 0 / 0
Регистрация: 12.02.2020
Сообщений: 4
14.11.2021, 02:42  [ТС]
В целом я хотел узнать какие инструменты лучше всего использовать для русского языка. Узнал благодаря Вам лабораторию анализа данных Александра Кукушкина и думаю что его проекты отлично подходят для задач NLP.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
14.11.2021, 02:42
Помогаю со студенческими работами здесь

Библиотеки С/С++ для цифровой обработки сигналов
Доброго времени суток! Хотел узнать, быть может кто-нибудь знает библиотеку/библиотеки С/С++ для цифровой обработки сигналов. Чтобы была...

Где можно найти шрифты для русского текста для Паскаль Борланд?
Где можно найти шрифты для русского текста для Паскаль Борланд? Добавлено через 2 минуты и как в графике поставить фон белым цветом?...

Функции для обработки строк библиотеки string.h
Поменять в введённой строке четвертое слово и симметричное слово максимальной длины (последнее по порядку), содержащее фрагмент «ин».

Программа для перевода текста с русского на английский
Здравствуйте! У меня проблема,Я не могу написать программу для перевода текста с русского на англиский.Кто может мне помочь?

Добавление данных в текстовый файл.Другие процедуры и функции для обработки текстовыхй файлов
Помогите решить вот эту задачку: В одномерном массиве, состоящем из N вещественных элементов, ВЫЧИСЛИТЬ произведение элементов стоящих на...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие. Ссылка в Linux — это дополнительная запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая. . .
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора ВВЕДЕНИЕ Выполняя задание на управление насосной группой заполнения резервуара,. . .
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru