Форум программистов, компьютерный форум, киберфорум
Python: Решение задач
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 02.06.2020
Сообщений: 4

Кластеризация данных из таблицы Excel

29.12.2021, 11:54. Показов 1132. Ответов 0

Студворк — интернет-сервис помощи студентам
У меня задача - реализовать кластеризацию данных из таблицы Excel любым простым методом на языке Python.

Пытался реализовать метод, который нашёл на просторах интернета, но что-то не работает.

Вот код:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
import pandas as pd
from sklearn.preprocessing import scale
from sklearn.cluster import DBSCAN, AffinityPropagation, Birch
from sklearn.manifold import TSNE
import plotly.express as px
from sklearn.cluster import KMeans
 
df = pd.read_excel("importFORlr4.xlsx", index_col=0)
 
df_scaled = pd.DataFrame(scale(df), index=df.index, columns=df.columns)
 
tsne = TSNE(n_components=2)
 
res = pd.DataFrame(tsne.fit_transform(df_scaled),
                   columns=list("xy"), index=df_scaled.index)
res['text'] = df.index.astype(str) + " (" + df['DATE'].astype(str) + ")"
color = df.index.astype('category').codes / df.index.nunique()
fig = px.scatter(res, x='x', y='y', hover_data=['text'], color=color)
fig.write_html('res.html')
 
df_agg = df_scaled.groupby(level=0).mean()
 
n_clusters = 6  # ожидаемое число кластеров
 
def get_cluster_res(model, df, names):
    res = pd.DataFrame({'name': names}, index=df.index)
    res['cluster'] = model.fit_predict(df)
    return res.groupby('cluster')['name'].apply(list).to_dict()
 
get_cluster_res(KMeans(n_clusters=n_clusters), df_agg, names=df_agg.index)
get_cluster_res(Birch(n_clusters=n_clusters), df_agg, names=df_agg.index)
Вложения
Тип файла: xlsx importFORlr4.xlsx (66.0 Кб, 2 просмотров)
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
29.12.2021, 11:54
Ответы с готовыми решениями:

Кластеризация данных таблицы
Добрый день! Дан двухмерный массив нулей и единиц размером X,Y (таблица) Требуется написать функцию, которая для всех единиц напишет...

Экспорт данных из таблицы Excel в Word или Excel по шаблонам
Всем здравствуйте! В продолжении темы созданной ранее https://www.cyberforum.ru/vba/thread3146920.html возникла необходимость...

Добавление внешних данных таблицы Excel а Visio VBA из файла Excel используя макросы
В файле Excel много таблиц, сформированных как именованные диапазоны. Из файла Visio добавление внешних данных этих таблиц вручную...

0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
29.12.2021, 11:54
Помогаю со студенческими работами здесь

Экспорт данных из таблицы Excel в шаблон Excel
Добрый день! Проблемка заключается в следующем: В папке debug во вложении есть файл "Дмитров_расшифровка - копия". С него...

Перенос данных из Excel в две таблицы баз данных SQL-Server
Люди добрые помогите пожалуйста. Есть таблица Excel, я сделал перенос всех данных из нее в таблицу SQL-Server. Нужно, чтобы паралельно...

Как сделать экспорт данных из таблицы базы данных MSSQL 2008 в Excel на php?
Добрый день. Подскажите как сделать экспорт данных из таблицы базы данных MSSQL 2008 в Excel ? P.S.: на MySQl все просто, однако...

Кластеризация данных
Собственно не как не могу понять какой алгоритм подойдёт для такой задачи. Очень желательно не сложный в реализации алгоритм, с приемлемый...

Кластеризация хранилища данных
Здравствуйте. Подскажите, пожалуйста, каким методом я могу организовать кластер на Debian 11 из 3-х серверов для хранения данных по...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
1
Ответ Создать тему
Новые блоги и статьи
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели 8ATzM_2aurI
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2. Задача: запретить редактирование документа, если он открыт у другого пользователя. / / . . .
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои. А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20% kYBz3eJf3jQ
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
Горе от ума
kumehtar 07.04.2026
Эта мне ментальная установка, что вот прямо сейчас, мол, мне для полного счастья не хватает (нужное вписать), и когда я этого достигну - тогда и полный кайф. Одна из самых сильных ловушек на пути. . . .
Использование значений реквизитов справочника в документе, с определенными условиями и правами
Maks 07.04.2026
1. Контроль срока действия договора Алгоритм из решения ниже реализован на примере нетипового документа "ЗаявкаНаРаботу", разработанного в конфигурации КА2. Задача: уведомлять пользователя, если. . .
Доступность команды формы по условию
Maks 07.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: сделать доступной кнопку (команда формы "ЗавершитьСписание") при. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru