Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.86/7: Рейтинг темы: голосов - 7, средняя оценка - 4.86
0 / 0 / 0
Регистрация: 13.09.2015
Сообщений: 42

Объединить 3 numpy.ndarray в один pandas.DataFrame

27.10.2022, 15:23. Показов 1847. Ответов 19

Студворк — интернет-сервис помощи студентам
Приветствую.
Задача такая нужно объединить 3 numpy.ndarray в один pandas.DataFrame и создать 4 колонку которая по условию будет заполнятся наиболее частым значением из предыдущих 3.
Пример
 
T1 T2 T3 T4
1 2 2 2
2 1 3 random
3 3 1 3
Знаю что объединять можно командой pandas.DataFrame.apply а вот как создать еще один столбец и заполнить его еще и с условием не хватает опыта.
Помогите кто чем может пожалуйста.
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
27.10.2022, 15:23
Ответы с готовыми решениями:

Pandas. Объединить DataFrame
Приветствую всех! Коллеги, подскажите. Я спарсил xml файл с помощью xmltodict. Получил два датафрейма (пришлось делать два из-за...

Numpy Expected type 'Union[ndarray, Iterable, int, float]', got 'ScreenShot' instead
Подскажите пожалуйста, как избавиться от ошибки. На саму программу, это ошибка не влияет, но хочется ее убрать. import numpy as np ...

Pandas dataframe
Доброго дня форумчане. Возник следующий вопрос. Есть у меня таблица, которую необходимо "перевернуть". Так dataframe...

19
5515 / 2868 / 571
Регистрация: 07.11.2019
Сообщений: 4,758
27.10.2022, 15:39
Можно объединить столбцы с использованием np.hstack или np.vstack
Последний столбец можно расчитать как моду. Scipy, stats, функция mode()
А затем все это перевести уже в Pandas.
0
Эксперт Python
8848 / 4500 / 1864
Регистрация: 27.03.2020
Сообщений: 7,316
27.10.2022, 19:00
AlexsSStep,
...как создать еще один столбец и заполнить его еще и с условием ...
Можно так:
Python
1
2
3
4
5
6
7
8
9
10
...
def fun(x):
    tmp = x.value_counts()
    if len(tmp) > 1 and tmp.iloc[0] == tmp.iloc[1]:
        return 'random'
    else:
        return x.mode()
 
df['t4'] = df.apply(fun, axis=1)
...
2
 Аватар для VistaSV30
986 / 330 / 79
Регистрация: 10.04.2012
Сообщений: 1,239
Записей в блоге: 4
27.10.2022, 21:23
Еще вариант:
Python
1
2
3
4
5
6
7
8
9
10
11
import numpy as np
import pandas as pd
 
n = 10
t1 = np.random.randint(1, 4, size = (n, 1))
t2 = np.random.randint(1, 4, size = (n, 1))
t3 = np.random.randint(1, 4, size = (n, 1))
 
df = pd.DataFrame(np.concatenate((t1, t2, t3), axis=1), columns=list('ABC'))
df['Mode'] = df.mode(axis=1)[0]
print(df)
1
Эксперт Python
8848 / 4500 / 1864
Регистрация: 27.03.2020
Сообщений: 7,316
27.10.2022, 22:02
VistaSV30, нужен 'random':
Python
1
2
3
4
5
6
7
8
9
10
11
12
import numpy as np
import pandas as pd
 
n = 10
t1 = np.random.randint(1, 4, size = (n, 1))
t2 = np.random.randint(1, 4, size = (n, 1))
t3 = np.random.randint(1, 4, size = (n, 1))
 
df = pd.DataFrame(np.concatenate((t1, t2, t3), axis=1), columns=list('ABC'))
df1 = df.mode(axis=1)
df['mode'] = np.where(df1[2].isna(), df1[0], 'random')
print(df)
1
 Аватар для VistaSV30
986 / 330 / 79
Регистрация: 10.04.2012
Сообщений: 1,239
Записей в блоге: 4
27.10.2022, 22:35
Gdez, еще вариант, но не могу понять как побороть предупреждение
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
import numpy as np
import pandas as pd
 
n = 10
t1 = np.random.randint(1, 4, size = (n, 1))
t2 = np.random.randint(1, 4, size = (n, 1))
t3 = np.random.randint(1, 4, size = (n, 1))
 
df = pd.DataFrame(np.concatenate((t1, t2, t3), axis=1), columns=list('ABC'))
df1 = df.mode(axis=1)
df['Mode'] = df1[0]
# df['Mode'][df1.count(axis=1)>1] = 'random'  # - выдает предупреждение
df['Mode'].loc[df1.count(axis=1)>1] = 'random'  # - тоже выдает предупреждение
print(df)
1
0 / 0 / 0
Регистрация: 13.09.2015
Сообщений: 42
31.10.2022, 12:18  [ТС]
Немного уточню вопроc
Python
1
2
3
4
type(t1)
type(predicted_rfc)
numpy.ndarray
print(t1)
принт картинка
вот на этой строке вот такая ошибка
df = pd.DataFrame(np.concatenate((t1, t2, t3), axis=1), columns=list('ABC'))
AxisError: axis 1 is out of bounds for array of dimension 1
Миниатюры
Объединить 3 numpy.ndarray в один pandas.DataFrame  
0
5515 / 2868 / 571
Регистрация: 07.11.2019
Сообщений: 4,758
31.10.2022, 12:34
А что выдает t1.shape?
0
0 / 0 / 0
Регистрация: 13.09.2015
Сообщений: 42
07.11.2022, 07:24  [ТС]
(2886,)

Добавлено через 1 минуту
и так все 3 переменные одинаковы
0
Эксперт Python
 Аватар для Red white socks
4523 / 1899 / 336
Регистрация: 18.01.2021
Сообщений: 3,489
07.11.2022, 07:59
Python
1
2
3
4
t1 = t1.reshape(-1,1)
t2 = t2.reshape(-1,1)
t3 = t3.reshape(-1,1)
df = pd.DataFrame(np.concatenate((t1, t2, t3), axis=1), columns=list('ABC'))
1
0 / 0 / 0
Регистрация: 13.09.2015
Сообщений: 42
07.11.2022, 08:20  [ТС]
Отлично reshape(-1,1) сработал.
и теперь последнее в 4 колонку мне надо не слово рандом а функцию случайного выбора из первых 3 колонок.
0
Эксперт Python
 Аватар для Red white socks
4523 / 1899 / 336
Регистрация: 18.01.2021
Сообщений: 3,489
07.11.2022, 09:04
Python
1
df['Mode'] = df.apply(lambda x: np.random.choice(x.mode()), axis = 1)
0
0 / 0 / 0
Регистрация: 13.09.2015
Сообщений: 42
10.11.2022, 17:10  [ТС]
Не работает в последнюю колонку вставляет 0 везде.
0
Эксперт Python
 Аватар для Red white socks
4523 / 1899 / 336
Регистрация: 18.01.2021
Сообщений: 3,489
10.11.2022, 17:17
AlexsSStep, другие колонки есть в датафрейме?
Скрин с результатом df.head() сделайте, до и после выполнения
0
0 / 0 / 0
Регистрация: 13.09.2015
Сообщений: 42
10.11.2022, 17:37  [ТС]
63,medium,low,medium,medium
64,medium,low,high,random
0
0 / 0 / 0
Регистрация: 13.09.2015
Сообщений: 42
10.11.2022, 17:43  [ТС]
Это скрин до и после
Миниатюры
Объединить 3 numpy.ndarray в один pandas.DataFrame   Объединить 3 numpy.ndarray в один pandas.DataFrame  
0
Эксперт Python
 Аватар для Red white socks
4523 / 1899 / 336
Регистрация: 18.01.2021
Сообщений: 3,489
10.11.2022, 17:59
выполняемый код скиньте.
4-ю колонку зачем сделали?
0
Эксперт Python
 Аватар для Red white socks
4523 / 1899 / 336
Регистрация: 18.01.2021
Сообщений: 3,489
10.11.2022, 18:00
У меня все нормально проходит
Миниатюры
Объединить 3 numpy.ndarray в один pandas.DataFrame  
0
0 / 0 / 0
Регистрация: 13.09.2015
Сообщений: 42
10.11.2022, 18:01  [ТС]
Python
1
2
3
4
5
6
7
8
9
predicted_rfc = predicted_rfc.reshape(-1, 1)
pred_mlp2 = pred_mlp2.reshape(-1, 1)
logreg_pred = logreg_pred.reshape(-1, 1)
 
pred_df = pd.DataFrame(np.concatenate((predicted_rfc, pred_mlp2, logreg_pred), axis=1), columns=list('ABC'))
pred_df1 = pred_df.mode(axis=1)
pred_df['target'] = np.where(pred_df1[2].isna(), pred_df1[0], 'randome')
pred_df['target'] = df.apply(lambda x: np.random.choice(x.mode()), axis = 1)
pred_df
0
Эксперт Python
 Аватар для Red white socks
4523 / 1899 / 336
Регистрация: 18.01.2021
Сообщений: 3,489
10.11.2022, 18:08
Лучший ответ Сообщение было отмечено AlexsSStep как решение

Решение

Python
1
df['target'] = df[['A','B','C']].apply(lambda x: np.random.choice(x.mode()), axis = 1)
Так попробуйте, хотя лишняя колонка не должна влиять так кардинально. Что-то выводить должен
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
10.11.2022, 18:08
Помогаю со студенческими работами здесь

Pandas Dataframe
я импортирую фрейм данных из excel. Столбец 1 установлен как индекс. Я хочу проверить в индекс (Столбец 1) пустой ячейке с помощью цикла...

Dataframe pandas
Всем привет! Есть dataframe книги. Автор1 книга 1 Автор 2 книга 2 Автор 1 книга 3 Как можно сформировать xml файл с...

Выборка в DataFrame Pandas
Подскажите пожалуйста с задачей, не выходит сделать выборку, как в задании в DataFrame Pandas. 1.Оставьте в выборке только те...

Столбец с условием в pandas dataframe
Всем привет, есть dataframe, необходимо добавить столбец d, который бы вычислялся на основе условий содержимого столбцов a,b,c. import...

Pandas, dataframe, to_csv, csvformatter
Добрый день! Помогите, пожалуйста. Делаю экспорт таблицы с помощью класса CSVFormatter в файл csv. Хочу, чтобы везде было по 3 знака...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
20
Ответ Создать тему
Новые блоги и статьи
Первый деплой
lagorue 16.01.2026
Не спеша развернул своё 1ое приложение в kubernetes. А дальше мне интересно создать 1фронтэнд приложения и 2 бэкэнд приложения развернуть 2 деплоя в кубере получится 2 сервиса и что-бы они. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит токи на L и напряжения на C в установ. режимах до и. . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Изучаю kubernetes
lagorue 13.01.2026
А пригодятся-ли мне знания kubernetes в России?
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru