Разбить список и словарь на колонки в df

@mata-hary · Регистрация: 29.03.2022

Студворк — интернет-сервис помощи студентам

Здравствуйте, я совсем пока новичок в питоне. Помогите оптимизировать код для выбора нужных значений из файла. Файл формата json со сложной вложенной структурой. Качаю с оф сайта https://opendata.mkrf.ru/opend... 331-egrkn/

Разбить список и словарь на колонки в df

Мне нужно выбрать лишь некоторые значения из столбца 'changes' и поместить их в dataFrame для последующего сохранения в geojson

Я написала такой код

:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
df = pd.DataFrame()
df_test = pd.DataFrame(data)
df_test = df_test[['nativeName', 'changes']]
bl = pd.DataFrame.from_records(df_test['changes'])
bl = bl.drop(columns=[1, 2, 3, 4])
bl2 = pd.DataFrame.from_records(bl[0])
bl3 = pd.DataFrame.from_records(bl2['diff'])
bl4 = pd.DataFrame.from_records(bl3[0])
df['Название'] = bl4['value'].apply((lambda x: x['general'].get('name') if isinstance(x, dict) else None))
df['Регион'] = bl4['value'].apply((lambda x: x['general'].get('region').get('value') if isinstance(x, dict) else None))
df['Категория'] = bl4['value'].apply((lambda x: x['general'].get('categoryType').get('value') if isinstance(x, dict) else None))
df['Вид'] = bl4['value'].apply((lambda x: x['general'].get('objectType').get('value') if isinstance(x, dict) else None))
df['ЮНЕСКО'] = bl4['value'].apply((lambda x: x['general'].get('unesco').get('value') if isinstance(x, dict) else None))
df['Статус'] = bl4['value'].apply((lambda x: x['general'].get('status').get('value') if isinstance(x, dict) else None))
df['Дата создания'] = bl4['value'].apply((lambda x: x['general'].get('createDate') if isinstance(x, dict) else None))
df['Адрес'] = bl4['value'].apply((lambda x: x['general'].get('address') if isinstance(x, dict) else None))
df['Тип'] = bl4['value'].apply((lambda x: x['general'].get('typologies') if isinstance(x, dict) else None))

В итоге получаю это:

И далее не могу разбить столбцы с адресом и типом на отдельные столбцы. На основе столбца адрес хочу создать промежуточный датафрейм, откуда потом скопировать столбцы в основной. Пишу код:

Python
1
df6 = pd.DataFrame.from_records(df['Адрес'])

Выдает ошибку:
'NoneType' object has no attribute 'keys'

Вопрос: как мне разбить столбцы с словарем и списком на отдельные колонки.

И второй вопрос: понимаю, что как-то все не очень верно делаю. Возможно сможет кто-нибудь подсказать, в каком направлении двигаться, чтобы оптимизировать все это.

@Gdez · 11.04.2022, 13:46

Странно...
Создал похожий фрейм, всё работает...

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
import pandas as pd
import numpy as np
 
df = pd.DataFrame({'code': list('abcde'),
                'adress': [{'add': "a1, b1, c1, d1",
                            'pos': {'coor': [1,11], 'type': 'P'}},
                           {'add': "a2, b2, c2, d2",
                            'pos': {'coor': [2,22], 'type': 'P'}},
                           {'add': "a3, b3, c3, d3",
                            'pos': {'coor': [3,33], 'type': 'P'}},
                           {'add': "a4, b4, c4, d4",
                            'pos': {'coor': [4,44], 'type': 'P'}},
                           {'add': "a5, b5, c5, d5",
                            'pos': {'coor': [5,55], 'type': 'P'}}]})
print(df)
 
df1 = pd.concat([df, pd.DataFrame.from_records(df.adress)], axis=1).drop('adress', axis=1)
print(df1)
 
df2 = pd.concat([df1, pd.DataFrame.from_records(df1.pos)], axis=1).drop('pos', axis=1)
print(df2)

@mata-hary · 11.04.2022, 16:58 **[ТС]**

А может быть проблема в том, что внутри столбца есть тип NaN? Попробовала формулы ваши, при попытке сделать:

Python
1
df6 = pd.concat([df6, pd.DataFrame.from_records(df6.typologies)], axis=1).drop('typologies', axis=1)

Выходит:

@Gdez · 11.04.2022, 19:12

mata-hary, может через прокладку "tmp"?:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
import pandas as pd
import numpy as np
 
df = pd.DataFrame({'code': list('abcde'),
                'adress': [{'add': "a1, b1, c1, d1",
                            'pos': np.nan},
                           {'add': "a2, b2, c2, d2",
                            'pos': {'coor': [2,22], 'type': 'P'}},
                           {'add': "a3, b3, c3, d3",
                            'pos': {'coor': [3,33], 'type': 'P'}},
                           {'add': "a4, b4, c4, d4",
                            'pos': {'coor': [4,44], 'type': 'P'}},
                           {'add': "a5, b5, c5, d5",
                            'pos': {'coor': [5,55], 'type': 'P'}}]})
#print(df)
 
df1 = pd.concat([df, pd.DataFrame.from_records(df.adress.dropna())], axis=1).drop('adress', axis=1)
print(df1)
 
###########
# можно это через функцию оформить, если есть еще "развертки" с вложенными nan
tmp = pd.DataFrame(df1.pos.dropna())
tmp.reset_index(level=0, inplace=True)
tmp = pd.concat([tmp, pd.DataFrame.from_records(tmp.pos)], axis=1).drop('pos', axis=1)
tmp.set_index('index', inplace=True)
print(tmp)
###########
 
df2 = pd.concat([df1, tmp], axis=1).drop('pos', axis=1)
print(df2)

@mata-hary · 11.04.2022, 21:57 **[ТС]**

благодарю! Это помогло

Новые блоги и статьи Все статьи Все блоги /
Символические и жёсткие ссылки в Linux. algri14 15.03.2026 Существует два типа ссылок — символические и жёсткие. Ссылка в Linux — это дополнительная запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая. . .	[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора ФедосеевПавел 14.03.2026 Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора ВВЕДЕНИЕ Выполняя задание на управление насосной группой заполнения резервуара,. . .	делаю науч статью по влиянию грибов на сукцессию anaschu 13.03.2026 прикрепляю статью	SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++ 8Observer8 10.03.2026 Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE 8Observer8 10.03.2026 Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .	Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки Neotwalker 08.03.2026 Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .	Модульная разработка через nuget packages DevAlt 07.03.2026 Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .	Модульный подход на примере F# DevAlt 06.03.2026 В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .

@mata-hary 1 / 1 / 0 Регистрация: 29.03.2022 Сообщений: 7
	11.04.2022, 21:57 [ТС]
	благодарю! Это помогло 0

Разбить список и словарь на колонки в df

Решение