Форум программистов, компьютерный форум, киберфорум
Python: Научные вычисления
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/8: Рейтинг темы: голосов - 8, средняя оценка - 5.00
0 / 0 / 0
Регистрация: 24.06.2018
Сообщений: 23

Преобразование признака и датафрейма

17.07.2018, 23:18. Показов 1796. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Коллеги, здравствуйте!

Подскажите пожалуйста по двум вопросам.

1. Имеется категориальный признак, который насчитывает 25 уникальных значений. Одно из этих значений составляет почти 75% от общего числа. Подскажите, нужно ли в таком случае делать дополнительные преобразования, вводить новый признак?

2. При преобразовании категориальноых признаков использовал функцию Normalize из библиотеки sklearn.preprocessing. Создал два датафрейма - X и Y. Функцию Normalize применил к X. Потом мне потребовалось соединить X и Y в один объект (использовал функцию concat), чтобы получить один датафрейм для дальнейшего использования. Но возникла ошибка типов - объект датафрейм и array (после применения Normalize). Каким образом можно сцепить два объекта или как можно нормализовать только одни признаки без целевой переменной в датафрейме(показывает принадлежность к классу - 0 или 1)?
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
17.07.2018, 23:18
Ответы с готовыми решениями:

Замена значений в столбце датафрейма из другого датафрейма
Здравствуйте! Есть фрейм данных в столбце которого нужно навести порядок, привести значения к единому виду. Нужно это сделать следующим...

Срез датафрейма
Здравствуйте,есть определенный датафрейм с большим кол-ом столбцов. Мне надо узнать, как влияют на продажи внутри одного лидирующего...

Срез данных датафрейма
Хочу рассчитать коэффициента Альфа Кронбаха для пула данных. def CronbachAlpha(itemscores): itemscores =...

1
431 / 302 / 90
Регистрация: 03.12.2015
Сообщений: 741
18.07.2018, 20:32
Цитата Сообщение от MrSergey86 Посмотреть сообщение
1. Имеется категориальный признак, который насчитывает 25 уникальных значений. Одно из этих значений составляет почти 75% от общего числа. Подскажите, нужно ли в таком случае делать дополнительные преобразования, вводить новый признак?
Да, нужно преобразовывать (например, с помощью OneHotEncoder), т.к. от этого признак может влиять на результат.

2. При преобразовании категориальноых признаков использовал функцию Normalize из библиотеки sklearn.preprocessing. Создал два датафрейма - X и Y. Функцию Normalize применил к X. Потом мне потребовалось соединить X и Y в один объект (использовал функцию concat), чтобы получить один датафрейм для дальнейшего использования. Но возникла ошибка типов - объект датафрейм и array (после применения Normalize). Каким образом можно сцепить два объекта или как можно нормализовать только одни признаки без целевой переменной в датафрейме(показывает принадлежность к классу - 0 или 1)?
Функция normalize вернула numpy array. Чтобы использовать функции из библиотеки pandas нужно преобразовать этот массив в датафрейм:
Python
1
pd.DataFrame(myarray)
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
18.07.2018, 20:32
Помогаю со студенческими работами здесь

Pandas индекс датафрейма
Добрый день! Я в питоне и пандах 0. Помогите, пожалуйста, если не сложно! mydf=pd.DataFrame({'data': , }, index=) ...

Pandas сортировка датафрейма
Доброго времени суток! Помогите пожалуйста чайнику! Есть у меня, скажем, табличка с фруктами и их количеством. И список фруктов с...

фильтрация датафрейма по нескольким условиям
Такой командой я фильтрую датафрейм по одному условию df == 'Да'] Такой командой я фильтрую датафрейм по двум условиям df == 'Да')...

Значение по условию в столбце датафрейма
В зависимости от значения столбца 1 необходимо вычислить значение в столбце 4 используя значение в столбце 2 или в столбце 3. Подскажите...

Сложная сортировка внутри датафрейма
Всем привет! У меня есть датафрейм: import pandas as pd data = {'num':, 'name':} df = pd.DataFrame(data) ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru