Форум программистов, компьютерный форум, киберфорум
Python: Базы данных
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
2 / 2 / 0
Регистрация: 31.10.2013
Сообщений: 124

Автоматическая смена длинных заголовков столбцов на короткое с сохранением информации

03.07.2024, 09:59. Показов 852. Ответов 4

Студворк — интернет-сервис помощи студентам
Приветствую, столкнулся с некоторой проблемой в плане помощи и заодно учебы.
Имеется таблица с 45 столбцами из яндекс форм одного НКО. Ниже пример

Кликните здесь для просмотра всего текста

IDВремя созданияВ каком регионе вы проживаете?Ваш возраст / 18 - 35 летВаш возраст / 36 - 55 летВаш возраст / 56 – 65 летКакую долю от ежемесячного дохода заемщика должны составлять совокупные ежемесячные платежи по всем долговым обязательствам, чтобы не вызывать у него затруднений? / не более 30%Какую долю от ежемесячного дохода заемщика должны составлять совокупные ежемесячные платежи по всем долговым обязательствам, чтобы не вызывать у него затруднений? / не более 50%Какую долю от ежемесячного дохода заемщика должны составлять совокупные ежемесячные платежи по всем долговым обязательствам, чтобы не вызывать у него затруднений? / не более 80%Какую долю от ежемесячного дохода заемщика должны составлять совокупные ежемесячные платежи по всем долговым обязательствам, чтобы не вызывать у него затруднений? / не более 100%Какую долю от ежемесячного дохода заемщика должны составлять совокупные ежемесячные платежи по всем долговым обязательствам, чтобы не вызывать у него затруднений? / БаллыНа что должен обратить внимание заемщик при заключении кредитного договора, чтобы понимать точный объем своих обязательств по кредиту? / Процентную ставку по кредитуНа что должен обратить внимание заемщик при заключении кредитного договора, чтобы понимать точный объем своих обязательств по кредиту? / Размер неустойки за нарушение условий договораНа что должен обратить внимание заемщик при заключении кредитного договора, чтобы понимать точный объем своих обязательств по кредиту? / Полную стоимость кредита, которая указывается в правом верхнем углу на первой странице договораНа что должен обратить внимание заемщик при заключении кредитного договора, чтобы понимать точный объем своих обязательств по кредиту? / БаллыВ течение какого срока заемщик может изучать кредитный договор, а кредитор не может изменить предложенные заемщику индивидуальные условия? / 5 рабочих днейВ течение какого срока заемщик может изучать кредитный договор, а кредитор не может изменить предложенные заемщику индивидуальные условия? / 5 календарных днейВ течение какого срока заемщик может изучать кредитный договор, а кредитор не может изменить предложенные заемщику индивидуальные условия? / 14 рабочих днейВ течение какого срока заемщик может изучать кредитный договор, а кредитор не может изменить предложенные заемщику индивидуальные условия? / 14 календарных днейВ течение какого срока заемщик может изучать кредитный договор, а кредитор не может изменить предложенные заемщику индивидуальные условия? / БаллыВ течение какого срока с момента заключения кредитного договора заемщик имеет право отказаться от оформленных вместе с ним дополнительных услуг и страховок, которые ему не нужны? / 5 календарных днейВ течение какого срока с момента заключения кредитного договора заемщик имеет право отказаться от оформленных вместе с ним дополнительных услуг и страховок, которые ему не нужны? / 10 календарных днейВ течение какого срока с момента заключения кредитного договора заемщик имеет право отказаться от оформленных вместе с ним дополнительных услуг и страховок, которые ему не нужны? / 14 календарных днейВ течение какого срока с момента заключения кредитного договора заемщик имеет право отказаться от оформленных вместе с ним дополнительных услуг и страховок, которые ему не нужны? / 30 календарных днейВ течение какого срока с момента заключения кредитного договора заемщик имеет право отказаться от оформленных вместе с ним дополнительных услуг и страховок, которые ему не нужны? / Баллы
16059620332024-01-23 18:23:59Москваnan36 - 55 летnanне более 30%nannannan1.0nannanПолную стоимость кредита, которая указывается в правом верхнем углу на первой странице договора1.05 рабочих днейnannannan1.0nannannan30 календарных дней1.0

В таблице на каждый ответ дублируется столбец, ну это пол беды, их объединить простым сложением вроде можно, но вот обращаться к ним не реально, да и для каждой таблицы объединения надо сопоставлять в ручную.
У меня возник вопрос, а есть ли какие то алгоритмы которые позволят сгруппировать эти столбцы по названию как части одного, дать нормальное имя и при этом оставить названия где то в метаданных.
У меня есть наметки, например, заменить все имена столбцов, похожие назвать "colN_partN" и позже объединить и дать общее имя например, "Вопрос бла-бла-бла". А старые(осмысленные) названия сохранить в другой таблице и индексами для них сделать новые названия. Но при всём при этом придется сопоставление имён столбцов делать в ручную.
Может кто подскажет какими инструментами можно воспользоваться для решения этой задачи, а там подобные названия можно складывать.
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
03.07.2024, 09:59
Ответы с готовыми решениями:

Автоматическая нумерация заголовков столбцов в DataGridView
Нужна помощь. Есть одна форма, в которой вводится информация (допустим некое количество столбцов), в другой форме должна сформироваться...

Разбиение Word файла на pdf с сохранением иерархии заголовков
Доброго времени суток! Уже несколько дней пытаюсь написать в visual studio 2012 программу, но увы безрезультатно. Суть проблемы: ...

Расположение текста из ворда в диапазоне эксель с сохранением заголовков и абзацев
Здравствуйте, специалисты по ВБА. Помогите решить вопрос. Есть документ 1.doc В нем есть некий текст, который написан с...

4
Просто Лис
Эксперт Python
 Аватар для Рыжий Лис
5973 / 3735 / 1099
Регистрация: 17.05.2012
Сообщений: 10,791
Записей в блоге: 9
03.07.2024, 15:57
То есть выгрузка в экселе выглядит так?

Code
1
2
3
4
5
строка с заголовками
строка с данными
строка с заголовками
строка с данными
…
0
2 / 2 / 0
Регистрация: 31.10.2013
Сообщений: 124
04.07.2024, 08:27  [ТС]
Цитата Сообщение от Рыжий Лис Посмотреть сообщение
То есть выгрузка в экселе выглядит так?
Не совсем, строка заголовка одна, дальше идут строки с данными, что бы не засорять пространство в таблицу добавил только одну строку с данными.

Добавлено через 44 минуты
Я написал такой вот скрипт
Кликните здесь для просмотра всего текста

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
# Прописываем имена для тех полей которые присутствуют во всех наборах данных
keywords = {
     'id': 'ID',
     'datetime': "Время создания",
     'region':   "В каком регионе вы проживаете",
     "age":      "Ваш возраст"
     "email":    "E-Mail"
}
 
 
 
 
def get_short_headers(columns: List) -> DataFrame:
    #Содаём словарь сопастовления
    matching_dict = {}
    question_index = 1
    part = 2
    for header in columns:
        match = re.search(r'([\w\s,]+)|ID([\s/?$])', header.strip())
        has_points = re.search(r'(Баллы$)', header.strip())
        match = match[1] if match else None
        has_points = has_points[1] if has_points else None
        match = match.strip()
        #print(match)
       
        
        if match in  keywords.values():
            key = [k for k, v in keywords.items() if v == match][0]
     
        if key not in matching_dict and match not in matching_dict.values():
            matching_dict[key] = match
        elif key in matching_dict and has_points:
            new_key = f'{key}_points'
            matching_dict[new_key] = match
        elif key in matching_dict and match  in matching_dict.values():
            new_key = f'{key}_{part}'
            part += 1
            matching_dict[new_key] = match
        else:
            part = 2
            key = f'question{question_index}'
            matching_dict[key] = match
            question_index += 1
        
       
    return pl.DataFrame(
        { 
            "index":   matching_dict.keys(),
            "values":  matching_dict.values(),
        }
    )

Теперь ломаю голову как объединить несколько столбцов количество которых не плавает от двух до N. простым циклом сделать не получается пока
0
6 / 6 / 2
Регистрация: 15.02.2012
Сообщений: 104
30.09.2024, 22:23
Stazot, Чтобы по-быстрому получить списки заголовков попробуйте методы/атрибуты df.cloumns, df.keys(), df.info(), df.dtypes. Некоторые прям в виде листа данных дают ответ.

На счет хранения какого-то скрытого имени колонки, честно говоря не слышал, а что собственно мешает их сохранить в словарь и оттуда вызывать?

Я правильно понимаю, что количество столбцов в типовом вопросе, например, возраст непостоянное в разных датафреймах?
0
2 / 2 / 0
Регистрация: 31.10.2013
Сообщений: 124
01.10.2024, 09:25  [ТС]
Цитата Сообщение от ostapovilya Посмотреть сообщение
Я правильно понимаю, что количество столбцов в типовом вопросе, например, возраст непостоянное в разных датафреймах?
Да оно не постоянное. и надо как бы сдвинуть их. Я решил эту задачу. Конечно насколько "красиво" я это сделал судить не берусь. Но получилось все данные по одному вопросу свести в одну колонку.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
01.10.2024, 09:25
Помогаю со студенческими работами здесь

Автоматическая вставка URL с обрезанием длинных ссылок
Есть текст с длинной ссылкой вроде http://msdn.microsoft.com/webservices/default.aspx?pull=/library/en-us/dnmitta/html/tvmwp.asp ...

DataGridView, подсветка заголовков столбцов
Всем, добрый вечер! Столкнулся с неожиданным поведением компонента DataGridView на Windows 10. При смене текущей ячейки подсвечивается...

Отображение заголовков столбцов в DataGridView
На форме 2 грида. 1-й главный. 2-й подчиненный, данные в нём отображаются в зависимости от выделенной строки 1-го грида. проблема...

Объединение заголовков столбцов datagridview
Добрый вечер. Можно ли объединить заголовки столбцов как показано на картинке? Скрин из Kaspersky Internet Security. Если он сделан...

Перенос заголовков в названиях столбцов DataGrid
Здравствуйте! В таблицы отображаются числовые данные, а заголовки у столбцов длинные, рода "Эмоциональная...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
Контроль корректности заполнения дат в зависимости от значения перечислений
Maks 12.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: реализовать контроль корректности заполнения дат назначения. . .
Архитектура слоя интернета для сервера-слоя.
Hrethgir 11.04.2026
В продолжение https:/ / www. cyberforum. ru/ blogs/ 223907/ 10860. html Знаешь что я подумал? Раз мы все источники пишем в голове ветки, то ничего не мешает добавить в голову такой источник, который сам. . .
Подстановка значения реквизита справочника в табличную часть документа
Maks 10.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: при выборе сотрудника (справочник Сотрудники) в ТЧ документа. . .
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях. Задача: при копировании документа очищать определенные реквизиты и табличную. . .
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели 8ATzM_2aurI
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2. Задача: запретить редактирование документа, если он открыт у другого пользователя. / / . . .
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои. А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20% kYBz3eJf3jQ
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru