Форум программистов, компьютерный форум, киберфорум
Python: Научные вычисления
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.77/13: Рейтинг темы: голосов - 13, средняя оценка - 4.77
4 / 4 / 2
Регистрация: 07.05.2014
Сообщений: 489

Классификация текстов

26.01.2018, 16:36. Показов 2536. Ответов 4
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Привет всем, подскажите пожалуйста, как и с чего начать для построения классификатора текста, то есть я я хочу разделить на два класса, является ли статья научной или нет ?
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
26.01.2018, 16:36
Ответы с готовыми решениями:

Классификация текстов
Привет всем! Заинтересовался темой обработки текстов, а в частности классификацией/кластеризацией. В большинстве примеров решения...

Мультиклассовая классификация в xgboost
Добрый день! Нужно построить модель с помощью мультиклассовой классификации в xgboost. В наборе данных имеется 4 класса. По итогу...

Классификация элементов последовательности на N классов
У меня есть задача классификации элементов на N классов. Проблема в том, что, строго говоря, эти классы нейросеть должна сама обозначить. ...

4
97 / 97 / 38
Регистрация: 30.11.2017
Сообщений: 180
26.01.2018, 16:39
Копай machine learning, там это стандартная задача
0
4 / 4 / 2
Регистрация: 07.05.2014
Сообщений: 489
30.01.2018, 16:46  [ТС]
Привет ещё раз, я так понимаю, чтобы реализовать такую задачу надо составить корпус слов....а что дальше?

Добавлено через 23 секунды
Вот сделал я словарь уникальных слов, в нормальной форме
0
578 / 411 / 69
Регистрация: 09.01.2018
Сообщений: 1,363
31.01.2018, 15:36
Цитата Сообщение от Rodmistar Посмотреть сообщение
Привет ещё раз, я так понимаю, чтобы реализовать такую задачу надо составить корпус слов....а что дальше?
А дальше, как и сказали применяется один из методов классификации или кластеризации. Какой именно - зависит от особенности задачи. "Копать" как и посоветовали - в сторону machine learning, основные разделы в внутри его - я указал выше. И да, есть куча книг-учебников по анализу текстов. А во многих книгах по machine learning отдельные разделы посвящены этой теме. Только вот разделы это практически последние в таких книгах, т.е. сначала изучаем методы ML, а уж потом их применяем для анализа текста.
Удачи.
0
277 / 226 / 93
Регистрация: 27.06.2016
Сообщений: 639
31.01.2018, 21:11
На классификацию категорий текста хорошо наивный Байес ложится. Но это не значит, что нужно обо всем другом забыть. Распространённые библиотеки позволяют достаточно легко экспериментировать с разными методами классификации и сравнивать результаты.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
31.01.2018, 21:11
Помогаю со студенческими работами здесь

Классификация текста к определенному классу SVM
Здравствуйте, есть у кого-нибудь пример классификации текста к определенному классу методом опорных векторов? Или хорошая, а главное...

VGG16. Классификация изображений (Cats vs. Dogs)
Всем доброго времени суток Мне для своего проекта нужно написать сверточную нейросеть. Решил для начала попробовать разные примеры....

Классификация периодов после изменения уровня данных
Проблема такая. Есть определенный индекс, его изменение было классифицировано как "Рост", "Без изменений",...

Семантический анализ текстов
Есть задача: для заданной уязвимости из БДУ ФСТЭК найти соответствующие ей угрозы из этой же БДУ. Вопрос в принципе изначально стоит,...

Строка: Произведите токенизацию строк, то есть разбиение текстов на слова.
Коллеги выручайте, застрял на совершенно простом задании, толкните простым понятным кодом. Задание такое: 1. Скачайте файл с...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
Архитектура слоя интернета для сервера-слоя.
Hrethgir 11.04.2026
В продолжение https:/ / www. cyberforum. ru/ blogs/ 223907/ 10860. html Знаешь что я подумал? Раз мы все источники пишем в голове ветки, то ничего не мешает добавить в голову такой источник, который сам. . .
Подстановка значения реквизита справочника в табличную часть документа
Maks 10.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: при выборе сотрудника (справочник Сотрудники) в ТЧ документа. . .
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях. Задача: при копировании документа очищать определенные реквизиты и табличную. . .
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели 8ATzM_2aurI
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2. Задача: запретить редактирование документа, если он открыт у другого пользователя. / / . . .
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои. А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20% kYBz3eJf3jQ
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru