С Новым годом! Форум программистов, компьютерный форум, киберфорум
Python: Научные вычисления
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.80/5: Рейтинг темы: голосов - 5, средняя оценка - 4.80
0 / 0 / 0
Регистрация: 24.06.2018
Сообщений: 23

Несбалансированный класс. Исправить показать precision по метке класса

20.07.2018, 16:28. Показов 1048. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Коллеги, здравствуйте!

Подскажите пожалуйста по вопросу.

У меня есть набор данных, данные несбалансированные. Меток одного класса 580 (0), а другого 20 (1). В одном файле находится набор с данными и принадлежностью к классам, а в другом набор тестовых данных. Пробовал решить задачу разными способами - undersampling, потом попробовал использовать библиотеку imblearn (код ниже):

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
# df_train_x, df_train_y - набор данных и принадлежность к классу (обучающая выборка). Класса два - 0 и 1
# df_test_x, df_test_y - тестовый набор с результатами
 
rus = RandomUnderSampler(return_indices=True)
X_resampled, y_resampled, idx_resampled = rus.fit_sample(df_train_x, df_train_y)
 
X_resampled = pd.DataFrame(X_resampled)
y_resampled = pd.DataFrame(y_resampled)
 
y = y_resampled.values
X = X_resampled.values
 
stdsc = StandardScaler()
x_train_std = stdsc.fit_transform(X)
x_test_std = stdsc.transform(df_test_x)
 
lr_model = LogisticRegression()
lr_model.fit(x_train_std, y)
 
predictions = lr_model.predict(x_test_std)
cnf_matrix=confusion_matrix(df_test_y, predictions)
Но как бы я не пробовал, результат почти всегда примерно такой:

Code
1
2
3
4
5
6
7
8
9
10
11
12
----------Classification Report------------------------------------
             precision    recall  f1-score   support
 
          0       0.98      0.44      0.61       589
          1       0.04      0.70      0.08        20
 
avg / total       0.95      0.45      0.59       609
 
TP 14
TN 259
FP 330
FN 6
Как сделать, чтобы значение 0.04 было выше? Получается, что у меня 330 объектов классификатор относит к 1.

Как можно поправить алгоритм? Всего у меня порядка 26 признаков.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
20.07.2018, 16:28
Ответы с готовыми решениями:

3 класса. Родительский класс - класс животных. Два класса наследника: Гиппопотамы и Зебры. Выбор структуры данных
Добрый День. Есть задача. Есть 3 класса. Родительский класс - это класс животных. Он абстрактный и содержит метод в котором считается...

Обращение к элементам класса (поставив точку, показать свойства и методы класса)
Есть класс Audio, у него есть две основных задачи воспроизводить и записывать звук (Recorder/Player). Хотелось бы, что бы все методы и...

Объявить несколько объектов класса, внести данные, и показать работу методов класса
Создать класс и включить в состав класса необходимый минимум методов, обеспечивающий полноценное функционирование объектов указанного...

1
277 / 226 / 93
Регистрация: 27.06.2016
Сообщений: 639
20.07.2018, 19:36
MrSergey86, я в этом пока плохо разбираюсь, но можешь попробовать поиграть с параметром class_weight у LogisticRegression, если это SkLearn. Было бы интересно услышать результаты.

http://scikit-learn.org/stable... ssion.html
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
20.07.2018, 19:36
Помогаю со студенческими работами здесь

Как обратиться к методу класса из формы и вывести в ней же (например на метке) результат действий этого метода
Помогите разобраться в этом элементарном вопросе! Какая то затыка не дает получить нужный результат вот код моего класса: using System;...

Объявить несколько объектов класса, внести данные с клавиатуры, и показать работу методов класса
Создать пустой проект, добавить файл *.cpp. В нем создать класс и включить в состав класса необходимый минимум методов, обеспечивающий...

Объявить несколько объектов класса, внести данные с клавиатуры, и показать работу методов класса, используя меню
Здравствуйте, есть задание 1) Добавить в проект класс (заголовочный файл class.h и файл class.cpp). В заголовочном файле class.h создать...

Есть класс A и класс B, класс B вложен в класс A и вложен в него, как классу B получить доступ к переменным класса A просто по имени?
На самом деле ничё фантастического я не прошу, ведь: template <class T> class matrix { friend class diagonal; ...

Создать класс, представляющий обучающий класс ClassRoom. Создайте класс ученик Pupil. В теле класса создайте методы void
Добрый день.помогите пожалуйста новичку с решением.буду очень благодарен .заранее благодарю.сам не могу решить.хочется посмотреть код ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Изучаю kubernetes
lagorue 13.01.2026
А пригодятся-ли мне знания kubernetes в России?
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/ O1rJuneU_ls https:/ / vkvideo. ru/ video-115721503_456239114
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR ВВЕДЕНИЕ Введу сокращения: аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru