Форум программистов, компьютерный форум, киберфорум
Python: Базы данных
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
2 / 2 / 0
Регистрация: 31.10.2013
Сообщений: 123

Автоматическая смена длинных заголовков столбцов на короткое с сохранением информации

03.07.2024, 09:59. Показов 749. Ответов 4

Студворк — интернет-сервис помощи студентам
Приветствую, столкнулся с некоторой проблемой в плане помощи и заодно учебы.
Имеется таблица с 45 столбцами из яндекс форм одного НКО. Ниже пример

Кликните здесь для просмотра всего текста

IDВремя созданияВ каком регионе вы проживаете?Ваш возраст / 18 - 35 летВаш возраст / 36 - 55 летВаш возраст / 56 – 65 летКакую долю от ежемесячного дохода заемщика должны составлять совокупные ежемесячные платежи по всем долговым обязательствам, чтобы не вызывать у него затруднений? / не более 30%Какую долю от ежемесячного дохода заемщика должны составлять совокупные ежемесячные платежи по всем долговым обязательствам, чтобы не вызывать у него затруднений? / не более 50%Какую долю от ежемесячного дохода заемщика должны составлять совокупные ежемесячные платежи по всем долговым обязательствам, чтобы не вызывать у него затруднений? / не более 80%Какую долю от ежемесячного дохода заемщика должны составлять совокупные ежемесячные платежи по всем долговым обязательствам, чтобы не вызывать у него затруднений? / не более 100%Какую долю от ежемесячного дохода заемщика должны составлять совокупные ежемесячные платежи по всем долговым обязательствам, чтобы не вызывать у него затруднений? / БаллыНа что должен обратить внимание заемщик при заключении кредитного договора, чтобы понимать точный объем своих обязательств по кредиту? / Процентную ставку по кредитуНа что должен обратить внимание заемщик при заключении кредитного договора, чтобы понимать точный объем своих обязательств по кредиту? / Размер неустойки за нарушение условий договораНа что должен обратить внимание заемщик при заключении кредитного договора, чтобы понимать точный объем своих обязательств по кредиту? / Полную стоимость кредита, которая указывается в правом верхнем углу на первой странице договораНа что должен обратить внимание заемщик при заключении кредитного договора, чтобы понимать точный объем своих обязательств по кредиту? / БаллыВ течение какого срока заемщик может изучать кредитный договор, а кредитор не может изменить предложенные заемщику индивидуальные условия? / 5 рабочих днейВ течение какого срока заемщик может изучать кредитный договор, а кредитор не может изменить предложенные заемщику индивидуальные условия? / 5 календарных днейВ течение какого срока заемщик может изучать кредитный договор, а кредитор не может изменить предложенные заемщику индивидуальные условия? / 14 рабочих днейВ течение какого срока заемщик может изучать кредитный договор, а кредитор не может изменить предложенные заемщику индивидуальные условия? / 14 календарных днейВ течение какого срока заемщик может изучать кредитный договор, а кредитор не может изменить предложенные заемщику индивидуальные условия? / БаллыВ течение какого срока с момента заключения кредитного договора заемщик имеет право отказаться от оформленных вместе с ним дополнительных услуг и страховок, которые ему не нужны? / 5 календарных днейВ течение какого срока с момента заключения кредитного договора заемщик имеет право отказаться от оформленных вместе с ним дополнительных услуг и страховок, которые ему не нужны? / 10 календарных днейВ течение какого срока с момента заключения кредитного договора заемщик имеет право отказаться от оформленных вместе с ним дополнительных услуг и страховок, которые ему не нужны? / 14 календарных днейВ течение какого срока с момента заключения кредитного договора заемщик имеет право отказаться от оформленных вместе с ним дополнительных услуг и страховок, которые ему не нужны? / 30 календарных днейВ течение какого срока с момента заключения кредитного договора заемщик имеет право отказаться от оформленных вместе с ним дополнительных услуг и страховок, которые ему не нужны? / Баллы
16059620332024-01-23 18:23:59Москваnan36 - 55 летnanне более 30%nannannan1.0nannanПолную стоимость кредита, которая указывается в правом верхнем углу на первой странице договора1.05 рабочих днейnannannan1.0nannannan30 календарных дней1.0

В таблице на каждый ответ дублируется столбец, ну это пол беды, их объединить простым сложением вроде можно, но вот обращаться к ним не реально, да и для каждой таблицы объединения надо сопоставлять в ручную.
У меня возник вопрос, а есть ли какие то алгоритмы которые позволят сгруппировать эти столбцы по названию как части одного, дать нормальное имя и при этом оставить названия где то в метаданных.
У меня есть наметки, например, заменить все имена столбцов, похожие назвать "colN_partN" и позже объединить и дать общее имя например, "Вопрос бла-бла-бла". А старые(осмысленные) названия сохранить в другой таблице и индексами для них сделать новые названия. Но при всём при этом придется сопоставление имён столбцов делать в ручную.
Может кто подскажет какими инструментами можно воспользоваться для решения этой задачи, а там подобные названия можно складывать.
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
03.07.2024, 09:59
Ответы с готовыми решениями:

Автоматическая нумерация заголовков столбцов в DataGridView
Нужна помощь. Есть одна форма, в которой вводится информация (допустим некое количество столбцов), в другой форме должна сформироваться...

Разбиение Word файла на pdf с сохранением иерархии заголовков
Доброго времени суток! Уже несколько дней пытаюсь написать в visual studio 2012 программу, но увы безрезультатно. Суть проблемы: ...

Расположение текста из ворда в диапазоне эксель с сохранением заголовков и абзацев
Здравствуйте, специалисты по ВБА. Помогите решить вопрос. Есть документ 1.doc В нем есть некий текст, который написан с...

4
Просто Лис
Эксперт Python
 Аватар для Рыжий Лис
5972 / 3734 / 1099
Регистрация: 17.05.2012
Сообщений: 10,791
Записей в блоге: 9
03.07.2024, 15:57
То есть выгрузка в экселе выглядит так?

Code
1
2
3
4
5
строка с заголовками
строка с данными
строка с заголовками
строка с данными
…
0
2 / 2 / 0
Регистрация: 31.10.2013
Сообщений: 123
04.07.2024, 08:27  [ТС]
Цитата Сообщение от Рыжий Лис Посмотреть сообщение
То есть выгрузка в экселе выглядит так?
Не совсем, строка заголовка одна, дальше идут строки с данными, что бы не засорять пространство в таблицу добавил только одну строку с данными.

Добавлено через 44 минуты
Я написал такой вот скрипт
Кликните здесь для просмотра всего текста

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
# Прописываем имена для тех полей которые присутствуют во всех наборах данных
keywords = {
     'id': 'ID',
     'datetime': "Время создания",
     'region':   "В каком регионе вы проживаете",
     "age":      "Ваш возраст"
     "email":    "E-Mail"
}
 
 
 
 
def get_short_headers(columns: List) -> DataFrame:
    #Содаём словарь сопастовления
    matching_dict = {}
    question_index = 1
    part = 2
    for header in columns:
        match = re.search(r'([\w\s,]+)|ID([\s/?$])', header.strip())
        has_points = re.search(r'(Баллы$)', header.strip())
        match = match[1] if match else None
        has_points = has_points[1] if has_points else None
        match = match.strip()
        #print(match)
       
        
        if match in  keywords.values():
            key = [k for k, v in keywords.items() if v == match][0]
     
        if key not in matching_dict and match not in matching_dict.values():
            matching_dict[key] = match
        elif key in matching_dict and has_points:
            new_key = f'{key}_points'
            matching_dict[new_key] = match
        elif key in matching_dict and match  in matching_dict.values():
            new_key = f'{key}_{part}'
            part += 1
            matching_dict[new_key] = match
        else:
            part = 2
            key = f'question{question_index}'
            matching_dict[key] = match
            question_index += 1
        
       
    return pl.DataFrame(
        { 
            "index":   matching_dict.keys(),
            "values":  matching_dict.values(),
        }
    )

Теперь ломаю голову как объединить несколько столбцов количество которых не плавает от двух до N. простым циклом сделать не получается пока
0
6 / 6 / 2
Регистрация: 15.02.2012
Сообщений: 104
30.09.2024, 22:23
Stazot, Чтобы по-быстрому получить списки заголовков попробуйте методы/атрибуты df.cloumns, df.keys(), df.info(), df.dtypes. Некоторые прям в виде листа данных дают ответ.

На счет хранения какого-то скрытого имени колонки, честно говоря не слышал, а что собственно мешает их сохранить в словарь и оттуда вызывать?

Я правильно понимаю, что количество столбцов в типовом вопросе, например, возраст непостоянное в разных датафреймах?
0
2 / 2 / 0
Регистрация: 31.10.2013
Сообщений: 123
01.10.2024, 09:25  [ТС]
Цитата Сообщение от ostapovilya Посмотреть сообщение
Я правильно понимаю, что количество столбцов в типовом вопросе, например, возраст непостоянное в разных датафреймах?
Да оно не постоянное. и надо как бы сдвинуть их. Я решил эту задачу. Конечно насколько "красиво" я это сделал судить не берусь. Но получилось все данные по одному вопросу свести в одну колонку.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
01.10.2024, 09:25
Помогаю со студенческими работами здесь

Автоматическая вставка URL с обрезанием длинных ссылок
Есть текст с длинной ссылкой вроде http://msdn.microsoft.com/webservices/default.aspx?pull=/library/en-us/dnmitta/html/tvmwp.asp ...

DataGridView, подсветка заголовков столбцов
Всем, добрый вечер! Столкнулся с неожиданным поведением компонента DataGridView на Windows 10. При смене текущей ячейки подсвечивается...

Отображение заголовков столбцов в DataGridView
На форме 2 грида. 1-й главный. 2-й подчиненный, данные в нём отображаются в зависимости от выделенной строки 1-го грида. проблема...

Объединение заголовков столбцов datagridview
Добрый вечер. Можно ли объединить заголовки столбцов как показано на картинке? Скрин из Kaspersky Internet Security. Если он сделан...

Перенос заголовков в названиях столбцов DataGrid
Здравствуйте! В таблицы отображаются числовые данные, а заголовки у столбцов длинные, рода "Эмоциональная...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
Фото: Daniel Greenwood
kumehtar 13.11.2025
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru