1 / 1 / 1
Регистрация: 30.05.2014
Сообщений: 35

Кластеризация в python

26.11.2019, 10:45. Показов 1904. Ответов 7
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Всем доброго времени суток!. В простом примере есть два класса: спортивные новости и другие произвольные статьи. При кластеризации текста, я использую логистическую регрессию из sklearn и получаю нормальные результаты, но я бы хотел использовать такой классификатор, который будет обучаться только на одном классе (спортивные новости) и в дальнейшем выдавать процентную соотносимость исследуемой новости к классу (спортивных новостей). В логистической регрессии на вход модели обучения необходимо подать минимум два класса, что немного неудобно потому что приходится готовить обучащую выборку как одного классса так и другого, а kmeans с оценкой расстояния от центра класстера не показал должных результатов. Подскажите классификатор, который может обучаться только на одном классе? Заранее спасибо если дочитали до конца и откликнулись
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
26.11.2019, 10:45
Ответы с готовыми решениями:

Кластеризация
Здравствуйте, уважаемые! Извините, что я к вам обращаюсь, но я попал в сложную ситуацию, в которой может оказаться каждый. :) Итак:...

Кластеризация
Ребят,кто-нибудь может объяснить как найти расстояния смешанных данных? Я изучила метод к-средних для числовых данных,где расстояние...

k-mean кластеризация
Доброго времени суток уважаемые програмисты! Вы знаете что сделать чтоб программа коректно работала? ...

7
533 / 438 / 47
Регистрация: 17.07.2013
Сообщений: 2,236
26.11.2019, 11:33
Цитата Сообщение от gravity48 Посмотреть сообщение
Подскажите классификатор, который может обучаться только на одном классе?
Очень интересная идея, типа "Один против всех".
0
1 / 1 / 1
Регистрация: 30.05.2014
Сообщений: 35
26.11.2019, 11:48  [ТС]
Просто это было бы удобно, есть возможность создать несколько классов, запустил их в цикле проверил на соотносимость в процентах выбрал лучшее или откинул бы в корзину
0
578 / 411 / 69
Регистрация: 09.01.2018
Сообщений: 1,363
26.11.2019, 11:54
Этот подраздел в теории классификации называется "One-class classification"
Забейте это у Гуугл получите достаточно информации для размышлений.
Начать можно отсюда:
https://en.wikipedia.org/wiki/... sification
https://datascience.stackexcha... sification
1
Эксперт Python
 Аватар для dondublon
4652 / 2072 / 366
Регистрация: 17.03.2012
Сообщений: 10,181
Записей в блоге: 6
27.11.2019, 14:30
gravity48,
Заранее спасибо если дочитали до конца и откликнулись
Пожалуйста.

Думаю, вы немного не с того конца мыслите. У вас как основа всего считается "логистическая регрессия", которой вы что-то подаёте. Но ЛР - это просто способ посчитать h от х. Сначала надо решить, что считать. Обучение-то вообще с учителем или без? Вы так легко перескакиваете от классификации к кластеризации (k-means):
При кластеризации текста, .... я бы хотел использовать ... классификатор,
0
578 / 411 / 69
Регистрация: 09.01.2018
Сообщений: 1,363
27.11.2019, 16:48
Цитата Сообщение от dondublon Посмотреть сообщение
gravity48,
Обучение-то вообще с учителем или без? Вы так легко перескакиваете от классификации к кластеризации (k-means):
Про перескакивание ТС - не спорю.
Но парадокс заключается в том. что в One-class classification, о которой я упомянул выше, эти две технологии практически сливаются воедино.
0
Эксперт Python
 Аватар для dondublon
4652 / 2072 / 366
Регистрация: 17.03.2012
Сообщений: 10,181
Записей в блоге: 6
28.11.2019, 11:13
passant, интересный метод, не знал.
0
1 / 1 / 1
Регистрация: 30.05.2014
Сообщений: 35
09.01.2020, 11:00  [ТС]
Спасибо большое за помощь! Использовал One-class classification, метод обучения с усителем, на практике использовал библиотеку sklearn, модуль "OneClassSVM". Обучение здесь - https://scikit-learn.org/stabl... -detection.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
09.01.2020, 11:00
Помогаю со студенческими работами здесь

Кластеризация
Разработать программу, реализующую следующие функции: 1. Генерация случайных точек на плоскости вокруг трѐх центров кластеризации (как ...

Кластеризация
всем привет. помогите разобраться: нужно провести кластерный анализ на любую тему: книги/авто/компы и тд. С помощью каких алгоритмов и ещё...

Кластеризация 8.2
Здравствуйте! Мы только кто перешли на 8.2. У нас 2 сервера, допустим, server0 и server1. При добавлении базы в список баз пользователей...

Кластеризация
Что такое кластеризация, как я могу дома попрактиковаться, или хотя бы теоритически объяснить что это такое, где, как, для чего, это...

Кластеризация
Доброго времени суток! Подскажите, пожалуйста. Нужно сравнить значение пикселей изображения (в оттенках серого) с определенным значением,...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
Опции темы

Новые блоги и статьи
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru