Форум программистов, компьютерный форум, киберфорум
Python: Научные вычисления
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.93/29: Рейтинг темы: голосов - 29, средняя оценка - 4.93
0 / 0 / 0
Регистрация: 12.02.2020
Сообщений: 4

NLTK для обработки русского текста и другие библиотеки

13.11.2021, 14:47. Показов 6495. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Насколько хорошо nltk обрабатывает русский текст и какие библиотеки стоит подучить что лучше работать с русским текстом?
Заранее спасибо за уделенное время
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
13.11.2021, 14:47
Ответы с готовыми решениями:

Ищу работающие библиотеки для парсинга русского языка
Всё что что сложнее pymorphy2 - либо уже не поддерживается, либо выдает ошибки.. Что сейчас актуально для python 3+?

Вводится произвольная строка русского текста, а также одна из букв русского алфавита. Удвоить эту букву в строке
Вводится произвольная строка русского текста, а также одна из букв русского алфавита. Удвоить эту букву в строке.

Как посмотреть какие библиотеки тянут другие библиотеки процесса
Привет, есть процесс, у него подтянуты dll'ки список которых я могу просматривать прогой Process Explorer. НО вопрос как посмотреть...

2
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
13.11.2021, 15:45
Лучший ответ Сообщение было отмечено 01zhas как решение

Решение

Цитата Сообщение от 01zhas Посмотреть сообщение
Насколько хорошо nltk обрабатывает русский текст
Что конкретно нужно?
NLTK практически не имеет моделей для русского языка.
Что-то можно прикручивать от сторонних разработчиков, но в зависимости от конкретной задачи лучше смотреть в сторону библиотек заточенных сразу под русский язык: pymorphy2 (только морфоанализ: POS tagger + inflection engine for Russian and Ukrainian languages) и стек библиотек natasha (там дофига всего, пока на полную конкуренцию с nltk все-таки не тянет, но это реально мощный проект для русскоязычного сектора NLP).
1
0 / 0 / 0
Регистрация: 12.02.2020
Сообщений: 4
14.11.2021, 02:42  [ТС]
В целом я хотел узнать какие инструменты лучше всего использовать для русского языка. Узнал благодаря Вам лабораторию анализа данных Александра Кукушкина и думаю что его проекты отлично подходят для задач NLP.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
14.11.2021, 02:42
Помогаю со студенческими работами здесь

Библиотеки С/С++ для цифровой обработки сигналов
Доброго времени суток! Хотел узнать, быть может кто-нибудь знает библиотеку/библиотеки С/С++ для цифровой обработки сигналов. Чтобы была...

Где можно найти шрифты для русского текста для Паскаль Борланд?
Где можно найти шрифты для русского текста для Паскаль Борланд? Добавлено через 2 минуты и как в графике поставить фон белым цветом?...

Функции для обработки строк библиотеки string.h
Поменять в введённой строке четвертое слово и симметричное слово максимальной длины (последнее по порядку), содержащее фрагмент «ин».

Программа для перевода текста с русского на английский
Здравствуйте! У меня проблема,Я не могу написать программу для перевода текста с русского на англиский.Кто может мне помочь?

Добавление данных в текстовый файл.Другие процедуры и функции для обработки текстовыхй файлов
Помогите решить вот эту задачку: В одномерном массиве, состоящем из N вещественных элементов, ВЫЧИСЛИТЬ произведение элементов стоящих на...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru