Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.91/11: Рейтинг темы: голосов - 11, средняя оценка - 4.91
2 / 2 / 0
Регистрация: 12.10.2019
Сообщений: 2

Выбор данных из csv в pandas

12.10.2019, 23:43. Показов 2143. Ответов 2

Студворк — интернет-сервис помощи студентам
Всем доброго дня/вечера/ночи. Задача состоит в следующем -

1. С помощью Pandas сгенерировать новый csv содержащий группировку по семьям где запись - информация об одиночном пассажире или сводка о семье если указаны члены семьи.

Поля в новом датасете:
• type - 1/0 (один пассажир или семья);
• name - фамилия (Allen, Allison);
• survived - общее количество выживших;
• age - средний возраст;
• boats - список шлюбок через ','.

Собственно данные - СSV с данными
Собственно вопрос - как это сделать? В приведённом ниже коде я описал свои мысли на этот счёт, но решение так и не надумал.

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
import pandas as pd
titanic_df = pd.read_csv('titanic.csv')
titanic_df = titanic_df.fillna('0')
titanic_df = titanic_df.astype({'pclass': 'int64', 'survived': 'int64', 'age': 'int64', 'sibsp': 'int64', 'parch': 'int64', 'body': 'int64', 'fare': 'float64'})
# Здесь я получаю фамилии 
titanic_df['name'] = titanic_df['name'].str.split(',').str[0]
# Определяю сколько членов в семье
titanic_df['Family_size'] = titanic_df['sibsp'] + titanic_df['parch'] + 1
titanic_df = titanic_df.sort_values(by='name')
# Избавляюсь от ненужных столбцов(серий)
titanic_df = titanic_df.drop({'pclass', 'sex', 'ticket', 'fare', 'cabin', 'embarked', 'home.dest', 'body'}, axis=1)
# Тут проблема, если я делаю так, то однофамильцы, не являющиеся родственниками, попадают под одну гребёнку
# а мне нужно всех одиночек у кого "Family_size = 1" не изменять. Пробовал через комбинацию .groupby .filter .agg
# но не работает из-за того, что функции возвращают/требуют разные типы (DataFrame и Series).
titanic_df.groupby('name').agg({'survived': 'sum', 'age': 'mean', 'boat': lambda x: ','.join(x), 'Family_size': 'max'})
Задание выполняю в anaconda-navigator, jupyterLab.
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
12.10.2019, 23:43
Ответы с готовыми решениями:

Определить типы данных CSV при загрузке в Pandas
Добрый день! Подскажите как правильно определить типы данных при загрузке из файла в формате CSV в Pandas? Сейчас делаю так и...

Pandas - сохранить формат данных при записи в файл csv
При сохранении фрейма и последующей загрузке преобразовывается формат данных. Подскажите как этого избежать? import pandas as pd d =...

Pandas, получение данных из файла csv
Приветствую всех программистов! Помогите решить данную задачу. Она простая, как 2+2, но я только недавно в этом начал разбираться :)...

2
Почетный модератор
 Аватар для Lord_Voodoo
8785 / 2538 / 144
Регистрация: 07.03.2007
Сообщений: 11,873
13.10.2019, 21:29
Zhuhel_Yevhen, судя по сообщению в жалобе, Вы нашли решение сами, а можно попросить Вас поделиться этим решением с форумом?
0
2 / 2 / 0
Регистрация: 12.10.2019
Сообщений: 2
13.10.2019, 22:07  [ТС]
Решил проблему таким образом - в 15-ой строчке передал функции значение сразу двух столбцов, по которым, я хочу сгруппировать данные:

Python
1
titanic_df = titanic_df.groupby(['type', 'name']).agg({'survived': 'sum', 'age': 'mean', 'boat': lambda x: ','.join(x)}).reset_index()
После этого стало походить на правду, правда я не знаю как грамотно проверить (сам проверял просто просмотрев таблицу).
2
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
13.10.2019, 22:07
Помогаю со студенческими работами здесь

Вывод данных pandas dataframe из csv в treeview
Здравствуйте, я чайник в Питоне и подавно в tkinter и pandas Хочу вывести все данные из csv файла именно в treeview при запуске...

Pandas и работа с csv файлом
Есть файл films.csv На всякий приложу в его в архиве Задача: Посчитать какого жанра среди прибыльных фильмов больше всего...

Вам доступен csv файл data.csv, содержащий информацию в csv формате.Напишите функцию read_csv для чтения данных из файла
Вам доступен CSV-файл data.csv, содержащий информацию в csv формате. Напишите функцию read_csv для чтения данных из этого файла. Она должна...

Корректная обработка csv файла в pandas
Всем доброго времени суток…. Задача состоит в следующим : Используя библиотеку pandas (python) на вход получаем csv файл в...

Pandas. Лишний символ ; при импорте из csv
Здравствуйте, имеются данные в csv, которые на первый взгляд нормально импортируется, но весь последний столбец почему-то обретает ; ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования. Часть библиотеки BedvitCOM Использованы. . .
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL3_image
8Observer8 27.01.2026
Содержание блога SDL3_image - это библиотека для загрузки и работы с изображениями. Эта пошаговая инструкция покажет, как загрузить и вывести на экран смартфона картинку с альфа-каналом, то есть с. . .
Влияние грибов на сукцессию
anaschu 26.01.2026
Бифуркационные изменения массы гриба происходят тогда, когда мы уменьшаем массу компоста в 10 раз, а скорость прироста биомассы уменьшаем в три раза. Скорость прироста биомассы может уменьшаться за. . .
Воспроизведение звукового файла с помощью SDL3_mixer при касании экрана Android
8Observer8 26.01.2026
Содержание блога SDL3_mixer - это библиотека я для воспроизведения аудио. В отличие от инструкции по добавлению текста код по проигрыванию звука уже содержится в шаблоне примера. Нужно только. . .
Установка Android SDK, NDK, JDK, CMake и т.д.
8Observer8 25.01.2026
Содержание блога Перейдите по ссылке: https:/ / developer. android. com/ studio и в самом низу страницы кликните по архиву "commandlinetools-win-xxxxxx_latest. zip" Извлеките архив и вы увидите. . .
Вывод текста со шрифтом TTF на Android с помощью библиотеки SDL3_ttf
8Observer8 25.01.2026
Содержание блога Если у вас не установлены Android SDK, NDK, JDK, и т. д. то сделайте это по следующей инструкции: Установка Android SDK, NDK, JDK, CMake и т. д. Сборка примера Скачайте. . .
Использование SDL3-callbacks вместо функции main() на Android, Desktop и WebAssembly
8Observer8 24.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru