Форум программистов, компьютерный форум, киберфорум
Python: Научные вычисления
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/8: Рейтинг темы: голосов - 8, средняя оценка - 5.00
0 / 0 / 0
Регистрация: 24.06.2018
Сообщений: 23

Преобразование признака и датафрейма

17.07.2018, 23:18. Показов 1832. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Коллеги, здравствуйте!

Подскажите пожалуйста по двум вопросам.

1. Имеется категориальный признак, который насчитывает 25 уникальных значений. Одно из этих значений составляет почти 75% от общего числа. Подскажите, нужно ли в таком случае делать дополнительные преобразования, вводить новый признак?

2. При преобразовании категориальноых признаков использовал функцию Normalize из библиотеки sklearn.preprocessing. Создал два датафрейма - X и Y. Функцию Normalize применил к X. Потом мне потребовалось соединить X и Y в один объект (использовал функцию concat), чтобы получить один датафрейм для дальнейшего использования. Но возникла ошибка типов - объект датафрейм и array (после применения Normalize). Каким образом можно сцепить два объекта или как можно нормализовать только одни признаки без целевой переменной в датафрейме(показывает принадлежность к классу - 0 или 1)?
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
17.07.2018, 23:18
Ответы с готовыми решениями:

Замена значений в столбце датафрейма из другого датафрейма
Здравствуйте! Есть фрейм данных в столбце которого нужно навести порядок, привести значения к единому виду. Нужно это сделать следующим...

Срез датафрейма
Здравствуйте,есть определенный датафрейм с большим кол-ом столбцов. Мне надо узнать, как влияют на продажи внутри одного лидирующего...

Срез данных датафрейма
Хочу рассчитать коэффициента Альфа Кронбаха для пула данных. def CronbachAlpha(itemscores): itemscores =...

1
431 / 302 / 90
Регистрация: 03.12.2015
Сообщений: 741
18.07.2018, 20:32
Цитата Сообщение от MrSergey86 Посмотреть сообщение
1. Имеется категориальный признак, который насчитывает 25 уникальных значений. Одно из этих значений составляет почти 75% от общего числа. Подскажите, нужно ли в таком случае делать дополнительные преобразования, вводить новый признак?
Да, нужно преобразовывать (например, с помощью OneHotEncoder), т.к. от этого признак может влиять на результат.

2. При преобразовании категориальноых признаков использовал функцию Normalize из библиотеки sklearn.preprocessing. Создал два датафрейма - X и Y. Функцию Normalize применил к X. Потом мне потребовалось соединить X и Y в один объект (использовал функцию concat), чтобы получить один датафрейм для дальнейшего использования. Но возникла ошибка типов - объект датафрейм и array (после применения Normalize). Каким образом можно сцепить два объекта или как можно нормализовать только одни признаки без целевой переменной в датафрейме(показывает принадлежность к классу - 0 или 1)?
Функция normalize вернула numpy array. Чтобы использовать функции из библиотеки pandas нужно преобразовать этот массив в датафрейм:
Python
1
pd.DataFrame(myarray)
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
18.07.2018, 20:32
Помогаю со студенческими работами здесь

Pandas индекс датафрейма
Добрый день! Я в питоне и пандах 0. Помогите, пожалуйста, если не сложно! mydf=pd.DataFrame({'data': , }, index=) ...

Pandas сортировка датафрейма
Доброго времени суток! Помогите пожалуйста чайнику! Есть у меня, скажем, табличка с фруктами и их количеством. И список фруктов с...

фильтрация датафрейма по нескольким условиям
Такой командой я фильтрую датафрейм по одному условию df == 'Да'] Такой командой я фильтрую датафрейм по двум условиям df == 'Да')...

Значение по условию в столбце датафрейма
В зависимости от значения столбца 1 необходимо вычислить значение в столбце 4 используя значение в столбце 2 или в столбце 3. Подскажите...

Сложная сортировка внутри датафрейма
Всем привет! У меня есть датафрейм: import pandas as pd data = {'num':, 'name':} df = pd.DataFrame(data) ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru