|
1 / 1 / 1
Регистрация: 30.05.2014
Сообщений: 35
|
|
Кластеризация в python26.11.2019, 10:45. Показов 1904. Ответов 7
Метки нет (Все метки)
Всем доброго времени суток!. В простом примере есть два класса: спортивные новости и другие произвольные статьи. При кластеризации текста, я использую логистическую регрессию из sklearn и получаю нормальные результаты, но я бы хотел использовать такой классификатор, который будет обучаться только на одном классе (спортивные новости) и в дальнейшем выдавать процентную соотносимость исследуемой новости к классу (спортивных новостей). В логистической регрессии на вход модели обучения необходимо подать минимум два класса, что немного неудобно потому что приходится готовить обучащую выборку как одного классса так и другого, а kmeans с оценкой расстояния от центра класстера не показал должных результатов. Подскажите классификатор, который может обучаться только на одном классе? Заранее спасибо если дочитали до конца и откликнулись
0
|
|
| 26.11.2019, 10:45 | |
|
Ответы с готовыми решениями:
7
Кластеризация Кластеризация k-mean кластеризация |
|
533 / 438 / 47
Регистрация: 17.07.2013
Сообщений: 2,236
|
|
| 26.11.2019, 11:33 | |
|
0
|
|
|
1 / 1 / 1
Регистрация: 30.05.2014
Сообщений: 35
|
|
| 26.11.2019, 11:48 [ТС] | |
|
Просто это было бы удобно, есть возможность создать несколько классов, запустил их в цикле проверил на соотносимость в процентах выбрал лучшее или откинул бы в корзину
0
|
|
|
578 / 411 / 69
Регистрация: 09.01.2018
Сообщений: 1,363
|
|
| 26.11.2019, 11:54 | |
|
Этот подраздел в теории классификации называется "One-class classification"
Забейте это у Гуугл получите достаточно информации для размышлений. Начать можно отсюда: https://en.wikipedia.org/wiki/... sification https://datascience.stackexcha... sification
1
|
|
|
|
|||
| 27.11.2019, 14:30 | |||
|
gravity48,
Думаю, вы немного не с того конца мыслите. У вас как основа всего считается "логистическая регрессия", которой вы что-то подаёте. Но ЛР - это просто способ посчитать h от х. Сначала надо решить, что считать. Обучение-то вообще с учителем или без? Вы так легко перескакиваете от классификации к кластеризации (k-means):
0
|
|||
|
578 / 411 / 69
Регистрация: 09.01.2018
Сообщений: 1,363
|
||
| 27.11.2019, 16:48 | ||
|
Но парадокс заключается в том. что в One-class classification, о которой я упомянул выше, эти две технологии практически сливаются воедино.
0
|
||
|
1 / 1 / 1
Регистрация: 30.05.2014
Сообщений: 35
|
|
| 09.01.2020, 11:00 [ТС] | |
|
Спасибо большое за помощь! Использовал One-class classification, метод обучения с усителем, на практике использовал библиотеку sklearn, модуль "OneClassSVM". Обучение здесь - https://scikit-learn.org/stabl... -detection.
0
|
|
| 09.01.2020, 11:00 | |
|
Помогаю со студенческими работами здесь
8
Кластеризация Кластеризация Кластеризация 8.2 Кластеризация Кластеризация Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
| Опции темы | |
|
|
Новые блоги и статьи
|
||||
|
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Налог на собак: https:/ / **********/ gallery/ V06K53e
Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf
Пост отсюда. . .
|
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop?
Ниже её машинный перевод.
После долгих разбирательств я наконец-то вернула себе. . .
|
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод
Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод.
Thinkpad X220 Tablet —. . .
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|