Форум программистов, компьютерный форум, киберфорум
Python: Научные вычисления
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.90/21: Рейтинг темы: голосов - 21, средняя оценка - 4.90
 Аватар для monahoff
40 / 40 / 23
Регистрация: 26.01.2012
Сообщений: 317

Лексический анализ текста

31.07.2017, 10:41. Показов 4411. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Привет!
Подскажите, где можно почитать или взять готовые "либы" для лексического анализа текста.
Задача: на вход поступает произвольный документ, на выходе анализатора вывод: художественная литература, техническая и прочие категории...! Копать, видимо, придется в машинное обучение, но если есть готовые наработки, пожалуйста, поделитесь!
Спс!
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
31.07.2017, 10:41
Ответы с готовыми решениями:

Лексический анализ текста
создать программу, выполняющую частичный лексический анализ текстовых файлов типа (.PAS) и выдающую результат в текстовый файл и на экран...

Лексический анализ текста
Привет! Подскажите, пожалуйста, где можно почитать или взять готовые "либы" для лексического анализа текста. Задача: на вход поступает...

Лексический анализ текста
Помогите пожалуйста с заданием: написать программу на visual prolog 7.2, выполняющую лексический анализ текста и определяющую тип ...

2
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
01.08.2017, 01:59
Цитата Сообщение от monahoff Посмотреть сообщение
где можно почитать или взять готовые "либы" для лексического анализа текста.
scikit-learn - основная python библиотека машинного обучения стартового уровня. Содержит все основные алгоритмы.
Еще есть nltk - для продвинутого Text Processing'а,
pymorphy2 - для морфоанализа русского текста. Обычно требуется для приведения слов к нормальной форме.

scikit-learn. Трудность изучения: medium (с матем. подготовкой - легко, но в этом случае пользуются либами из других ЯП и другими ЯП).
Ваша задача это не совсем лексический анализ, а что-то из этого:
1) классификация по меткам
2) тематической моделирование
3) кластеризация

Погуглите основные алгоритмы классификации\кластеризации в machine learning, затем загляните сюда - для понимания общей схемы кода (поскольку там сокращенный вариант и используются кастомные обертки, то использовать код копипастом не получится).

P.S. Здесь список литературы по ML
2
 Аватар для monahoff
40 / 40 / 23
Регистрация: 26.01.2012
Сообщений: 317
02.08.2017, 17:37  [ТС]
Благодарю за инфу!!!
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
02.08.2017, 17:37
Помогаю со студенческими работами здесь

Лексический и синтаксический анализ текста
Доброго времени суток, товарищи.Сейчас учусь в универе и дали задание курсовой работы на с++.Я читаю его и понятия не имею что нужно...

Лексический и синтаксический анализ текста
Доброго времени суток, нужно написать курсач по программированию - реализовать алгоритм лексического анализа предложений -...

Паскаль лексический анализ текста
Разработать программу, выполняющую частичный лексический анализ текстовых файлов типа «PAS» (программ на языке Паскаль) и выдающую...

Фонетический и лексический анализ литературного текста
Фонетический и лексический анализ литературного текста предусматривает подсчет количества каждой буквы алфавита, встречающейся в тексте, и...

лексический анализ
Добрый вечер всем. У меня такая проблема: мне надо разобрать строку на запчасти. Смысл такой - с клавиатуры вводится многочлен, его надо...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
Программный контроль заполнения реквизита табличной части документа
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: реализовать контроль заполнения реквизита "ПричинаСписания". . .
wmic не является внутренней или внешней командой
Maks 02.04.2026
Решение: DISM / Online / Add-Capability / CapabilityName:WMIC~~~~ Отсюда: https:/ / winitpro. ru/ index. php/ 2025/ 02/ 14/ komanda-wmic-ne-naydena/
Программная установка даты и запрет ее изменения
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: при создании документов установить период списания автоматически. . .
Вывод данных в справочнике через динамический список
Maks 01.04.2026
Реализация из решения ниже выполнена на примере нетипового справочника "Спецтехника" разработанного в конфигурации КА2. Задача: вывести данные из ТЧ нетипового документа. . .
Программное заполнения текстового поля в реквизите формы документа
Maks 01.04.2026
Алгоритм из решения ниже реализован на нетиповом документе "ВыдачаОборудованияНаСпецтехнику" разработанного в конфигурации КА2, в дополнении к предыдущему решению. На форме документа создается. . .
К слову об оптимизации
kumehtar 01.04.2026
Вспоминаю начало 2000-х, университет, когда я писал на Delphi. Тогда среди программистов на форумах активно обсуждали аккуратную работу с памятью: нужно было следить за переменными, вовремя. . .
Идея фильтра интернета (сервер = слой+фильтр).
Hrethgir 31.03.2026
Суть идеи заключается в том, чтобы запустить свой сервер, о чём я если честно мечтал давно и давно приобрёл книгу как это сделать. Но не было причин его запускать. Очумелые учёные напечатали на. . .
Модель здравосоХранения 6. ESG-повестка и устойчивое развитие; углублённый анализ кадрового бренда
anaschu 31.03.2026
В прикрепленном документе раздумья о том, как можно поменять модель в будущем
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru