Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.95/21: Рейтинг темы: голосов - 21, средняя оценка - 4.95
1 / 1 / 0
Регистрация: 29.03.2022
Сообщений: 7

Разбить список и словарь на колонки в df

11.04.2022, 12:27. Показов 4247. Ответов 4
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте, я совсем пока новичок в питоне. Помогите оптимизировать код для выбора нужных значений из файла. Файл формата json со сложной вложенной структурой. Качаю с оф сайта https://opendata.mkrf.ru/opend... 331-egrkn/


Мне нужно выбрать лишь некоторые значения из столбца 'changes' и поместить их в dataFrame для последующего сохранения в geojson

Я написала такой код :
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
df = pd.DataFrame()
df_test = pd.DataFrame(data)
df_test = df_test[['nativeName', 'changes']]
bl = pd.DataFrame.from_records(df_test['changes'])
bl = bl.drop(columns=[1, 2, 3, 4])
bl2 = pd.DataFrame.from_records(bl[0])
bl3 = pd.DataFrame.from_records(bl2['diff'])
bl4 = pd.DataFrame.from_records(bl3[0])
df['Название'] = bl4['value'].apply((lambda x: x['general'].get('name') if isinstance(x, dict) else None))
df['Регион'] = bl4['value'].apply((lambda x: x['general'].get('region').get('value') if isinstance(x, dict) else None))
df['Категория'] = bl4['value'].apply((lambda x: x['general'].get('categoryType').get('value') if isinstance(x, dict) else None))
df['Вид'] = bl4['value'].apply((lambda x: x['general'].get('objectType').get('value') if isinstance(x, dict) else None))
df['ЮНЕСКО'] = bl4['value'].apply((lambda x: x['general'].get('unesco').get('value') if isinstance(x, dict) else None))
df['Статус'] = bl4['value'].apply((lambda x: x['general'].get('status').get('value') if isinstance(x, dict) else None))
df['Дата создания'] = bl4['value'].apply((lambda x: x['general'].get('createDate') if isinstance(x, dict) else None))
df['Адрес'] = bl4['value'].apply((lambda x: x['general'].get('address') if isinstance(x, dict) else None))
df['Тип'] = bl4['value'].apply((lambda x: x['general'].get('typologies') if isinstance(x, dict) else None))
В итоге получаю это:


И далее не могу разбить столбцы с адресом и типом на отдельные столбцы. На основе столбца адрес хочу создать промежуточный датафрейм, откуда потом скопировать столбцы в основной. Пишу код:
Python
1
df6 = pd.DataFrame.from_records(df['Адрес'])
Выдает ошибку:
'NoneType' object has no attribute 'keys'

Вопрос: как мне разбить столбцы с словарем и списком на отдельные колонки.

И второй вопрос: понимаю, что как-то все не очень верно делаю. Возможно сможет кто-нибудь подсказать, в каком направлении двигаться, чтобы оптимизировать все это.
0
Лучшие ответы (1)
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
11.04.2022, 12:27
Ответы с готовыми решениями:

Разбить список на 3 колонки
Как разбить список на 3 колонки с помощью css? Вот код <html> <head> <title>title</title> <style...

Разбить список на колонки
Вот таким свойством разбиваю список на три колоники 1-Список 2-Список 3-Список 4-Список 5-Список 6-Список А мне надо 1-Список ...

Разбить список на три колонки
Есть список из БД, подскажите как его разбить на три части, чтобы треть шла в первой колонке, 2 треть во второй и т.д.? Пример: ...

4
Эксперт Python
8851 / 4502 / 1864
Регистрация: 27.03.2020
Сообщений: 7,317
11.04.2022, 13:46
Странно...
Создал похожий фрейм, всё работает...
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
import pandas as pd
import numpy as np
 
df = pd.DataFrame({'code': list('abcde'),
                'adress': [{'add': "a1, b1, c1, d1",
                            'pos': {'coor': [1,11], 'type': 'P'}},
                           {'add': "a2, b2, c2, d2",
                            'pos': {'coor': [2,22], 'type': 'P'}},
                           {'add': "a3, b3, c3, d3",
                            'pos': {'coor': [3,33], 'type': 'P'}},
                           {'add': "a4, b4, c4, d4",
                            'pos': {'coor': [4,44], 'type': 'P'}},
                           {'add': "a5, b5, c5, d5",
                            'pos': {'coor': [5,55], 'type': 'P'}}]})
print(df)
 
df1 = pd.concat([df, pd.DataFrame.from_records(df.adress)], axis=1).drop('adress', axis=1)
print(df1)
 
df2 = pd.concat([df1, pd.DataFrame.from_records(df1.pos)], axis=1).drop('pos', axis=1)
print(df2)
0
1 / 1 / 0
Регистрация: 29.03.2022
Сообщений: 7
11.04.2022, 16:58  [ТС]
А может быть проблема в том, что внутри столбца есть тип NaN? Попробовала формулы ваши, при попытке сделать:

Python
1
df6 = pd.concat([df6, pd.DataFrame.from_records(df6.typologies)], axis=1).drop('typologies', axis=1)
Выходит:
Миниатюры
Разбить список и словарь на колонки в df  
0
Эксперт Python
8851 / 4502 / 1864
Регистрация: 27.03.2020
Сообщений: 7,317
11.04.2022, 19:12
Лучший ответ Сообщение было отмечено mata-hary как решение

Решение

mata-hary, может через прокладку "tmp"?:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
import pandas as pd
import numpy as np
 
df = pd.DataFrame({'code': list('abcde'),
                'adress': [{'add': "a1, b1, c1, d1",
                            'pos': np.nan},
                           {'add': "a2, b2, c2, d2",
                            'pos': {'coor': [2,22], 'type': 'P'}},
                           {'add': "a3, b3, c3, d3",
                            'pos': {'coor': [3,33], 'type': 'P'}},
                           {'add': "a4, b4, c4, d4",
                            'pos': {'coor': [4,44], 'type': 'P'}},
                           {'add': "a5, b5, c5, d5",
                            'pos': {'coor': [5,55], 'type': 'P'}}]})
#print(df)
 
df1 = pd.concat([df, pd.DataFrame.from_records(df.adress.dropna())], axis=1).drop('adress', axis=1)
print(df1)
 
###########
# можно это через функцию оформить, если есть еще "развертки" с вложенными nan
tmp = pd.DataFrame(df1.pos.dropna())
tmp.reset_index(level=0, inplace=True)
tmp = pd.concat([tmp, pd.DataFrame.from_records(tmp.pos)], axis=1).drop('pos', axis=1)
tmp.set_index('index', inplace=True)
print(tmp)
###########
 
df2 = pd.concat([df1, tmp], axis=1).drop('pos', axis=1)
print(df2)
1
1 / 1 / 0
Регистрация: 29.03.2022
Сообщений: 7
11.04.2022, 21:57  [ТС]
благодарю! Это помогло
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
11.04.2022, 21:57
Помогаю со студенческими работами здесь

Не получается разбить список на 4 не равномерных колонки
Есть простой список (меню), его нужно разбить на 4 не равномерных колонки, никак немогу решить ету задачу. <ul...

Разбить List на словарь
Имеется List<String> someArray, имеется List<Int32> indexes; Как разбить на словарь лист someArray по имеющимся индексам из indexes? ...

Разбить словарь по буквам на половины
Как в новом стиле .NET можно решить такую задачу: 1. Имеется файл в виде построчного списка латинских слов уже в алфавитном порядке и...

Разбить строку на колонки
Друзья есть таблица Х ID|Column 1|Test , Test1 , Test2 2|Test, Test1 Помогите разбить стринг на разные колонки после запятой...

Разбить меню на 4 колонки
результат работы скрипта выглядит примерно так неизвестное количество элементов li в одном ul <ul class="menu"> ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие. Ссылка в Linux — это дополнительная запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая. . .
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора ВВЕДЕНИЕ Выполняя задание на управление насосной группой заполнения резервуара,. . .
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru