Форум программистов, компьютерный форум, киберфорум
Python: Научные вычисления
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.77/13: Рейтинг темы: голосов - 13, средняя оценка - 4.77
4 / 4 / 2
Регистрация: 07.05.2014
Сообщений: 489

Классификация текстов

26.01.2018, 16:36. Показов 2474. Ответов 4
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Привет всем, подскажите пожалуйста, как и с чего начать для построения классификатора текста, то есть я я хочу разделить на два класса, является ли статья научной или нет ?
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
26.01.2018, 16:36
Ответы с готовыми решениями:

Классификация текстов
Привет всем! Заинтересовался темой обработки текстов, а в частности классификацией/кластеризацией. В большинстве примеров решения...

Мультиклассовая классификация в xgboost
Добрый день! Нужно построить модель с помощью мультиклассовой классификации в xgboost. В наборе данных имеется 4 класса. По итогу...

Классификация элементов последовательности на N классов
У меня есть задача классификации элементов на N классов. Проблема в том, что, строго говоря, эти классы нейросеть должна сама обозначить. ...

4
97 / 97 / 38
Регистрация: 30.11.2017
Сообщений: 180
26.01.2018, 16:39
Копай machine learning, там это стандартная задача
0
4 / 4 / 2
Регистрация: 07.05.2014
Сообщений: 489
30.01.2018, 16:46  [ТС]
Привет ещё раз, я так понимаю, чтобы реализовать такую задачу надо составить корпус слов....а что дальше?

Добавлено через 23 секунды
Вот сделал я словарь уникальных слов, в нормальной форме
0
578 / 411 / 69
Регистрация: 09.01.2018
Сообщений: 1,363
31.01.2018, 15:36
Цитата Сообщение от Rodmistar Посмотреть сообщение
Привет ещё раз, я так понимаю, чтобы реализовать такую задачу надо составить корпус слов....а что дальше?
А дальше, как и сказали применяется один из методов классификации или кластеризации. Какой именно - зависит от особенности задачи. "Копать" как и посоветовали - в сторону machine learning, основные разделы в внутри его - я указал выше. И да, есть куча книг-учебников по анализу текстов. А во многих книгах по machine learning отдельные разделы посвящены этой теме. Только вот разделы это практически последние в таких книгах, т.е. сначала изучаем методы ML, а уж потом их применяем для анализа текста.
Удачи.
0
277 / 226 / 93
Регистрация: 27.06.2016
Сообщений: 639
31.01.2018, 21:11
На классификацию категорий текста хорошо наивный Байес ложится. Но это не значит, что нужно обо всем другом забыть. Распространённые библиотеки позволяют достаточно легко экспериментировать с разными методами классификации и сравнивать результаты.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
31.01.2018, 21:11
Помогаю со студенческими работами здесь

Классификация текста к определенному классу SVM
Здравствуйте, есть у кого-нибудь пример классификации текста к определенному классу методом опорных векторов? Или хорошая, а главное...

VGG16. Классификация изображений (Cats vs. Dogs)
Всем доброго времени суток Мне для своего проекта нужно написать сверточную нейросеть. Решил для начала попробовать разные примеры....

Классификация периодов после изменения уровня данных
Проблема такая. Есть определенный индекс, его изменение было классифицировано как "Рост", "Без изменений",...

Семантический анализ текстов
Есть задача: для заданной уязвимости из БДУ ФСТЭК найти соответствующие ей угрозы из этой же БДУ. Вопрос в принципе изначально стоит,...

Строка: Произведите токенизацию строк, то есть разбиение текстов на слова.
Коллеги выручайте, застрял на совершенно простом задании, толкните простым понятным кодом. Задание такое: 1. Скачайте файл с...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru