|
1 / 1 / 0
Регистрация: 17.11.2019
Сообщений: 12
|
|
Посоветуйте библиотеку для работы с текстом22.12.2019, 13:06. Показов 1103. Ответов 1
Господа, посоветуйте библиотеку для работы с текстом (английский, русский). Необходимо быстро вычленять из текста предложения, из предложений - слова (дерево, дереву, дерева - воспринимать как одно слово) и проч.
Спасибо заранее.
0
|
|
| 22.12.2019, 13:06 | |
|
Ответы с готовыми решениями:
1
Посоветуйте библиотеку для работы с майнкрафт ботом Посоветуйте библиотеку для работы с сетью Посоветуйте библиотеку для работы с сетью |
|
|
|
| 22.12.2019, 17:30 | |
|
Универсальной (для всех задач и языков) библиотеки нет.
А сам стек огромен - https://nlpub.mipt.ru/Обработка_текста. P.S. Лучший сегментатор предложений для русского - razdel. Из набора Natasha. nltk-ный сентенизер хорошо сегментирует только английские. Морфоанализ (для русского и украинского) - pymorphy2. Для английского - из nltk. Отдельные инструменты есть в gensim, spacy, pattern.
1
|
|
| 22.12.2019, 17:30 | |
|
Помогаю со студенческими работами здесь
2
Посоветуйте хорошую библиотеку для работы с pdf Посоветуйте библиотеку для работы с sqlite в delphi Посоветуйте хорошую библиотеку для работы с zip-архивами Посоветуйте плз библиотеку для работы с векторной графикой Посоветуйте хорошую PHP библиотеку для работы с файлами Exel Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
Модель микоризы: классовый агентный подход
anaschu 02.01.2026
Раньше это было два гриба и бактерия. Теперь три гриба, растение.
И на уровне агентов добавится между грибами или бактериями взаимодействий.
До того я пробовал подход через многомерные массивы,. . .
|
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути
Programma_Boinc 01.01.2026
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути
Сочетание глобально распределённой вычислительной мощности и инновационных. . .
|
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Налог на собак: https:/ / **********/ gallery/ V06K53e
Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf
Пост отсюда. . .
|
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop?
Ниже её машинный перевод.
После долгих разбирательств я наконец-то вернула себе. . .
|
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод
Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод.
Thinkpad X220 Tablet —. . .
|
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|