0 / 0 / 0
Регистрация: 09.11.2021
Сообщений: 7

Машинное обучение 2

19.10.2023, 18:19. Показов 1003. Ответов 2
Метки дз (Все метки)

Студворк — интернет-сервис помощи студентам
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
!pip install folium
 
import folium
 
m = folium.Map(location=(55.7522200, 37.6155600), zoom_start=10)
 
m
-------------------------
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
 
%matplotlib inline
 
sns.set(style="darkgrid")
-------------------------
#Задание 1
from google.colab import drive
drive.mount('/content/drive')
-------------------------
df = pd.read_csv('/content/drive/MyDrive/train.csv')
-------------------------
df = df.drop('dropoff_datetime', axis=1)
df['pickup_datetime'] = pd.to_datetime(df['pickup_datetime'])
df.head()
-------------------------
plt.hist(df['trip_duration'])
plt.title('Гистограмма распределения pickup_datetime')
plt.show()
-------------------------
df['log_trip_duration'] = np.log1p(df['trip_duration'])
df = df.drop('trip_duration', axis=1)
-------------------------
plt.hist(df['log_trip_duration'], bins=25)
plt.title('Гистограмма распределения log_trip_duration')
plt.show()
-------------------------
mean_log_trip_duration = ((df['log_trip_duration'] - df['log_trip_duration'].mean())**2).sum()/df['log_trip_duration'].shape[0]
mean_log_trip_duration
-------------------------
#Задание 2
# Подсчет количества повторяющихся дат
date_counts = df['pickup_datetime'].value_counts()
 
# Создание нового столбца 'date_counts', где каждой дате присваивается количество повторений
df['trip_counts'] = df['pickup_datetime'].map(date_counts)
-------------------------
df['pickup_datetime2'] = pd.to_datetime(df['pickup_datetime'])
 
# Установка 'pickup_datetime' как индекс
df.set_index('pickup_datetime2', inplace=True)
 
# Ресемплирование данных по дню и подсчет количества поездок
daily_trip_counts = df['trip_counts'].resample('D').sum()
 
# Построение графика
plt.figure(figsize=(12, 6))
sns.countplot(data=df, x=df.index.date, color='skyblue')
plt.xlabel('Дата')
plt.ylabel('Количество поездок')
plt.title('Зависимость количества поездок от даты')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
----------------------------
min_trip_counts_index = df['trip_counts'].idxmin()
 
# Извлечь данные с минимальным количеством поездок
min_trip_counts_data = df.loc[min_trip_counts_index]
 
# Вывести данные с минимальным количеством поездок
print("Данные с минимальным количеством поездок:")
print(min_trip_counts_data)
----------------------------
df['pickup_datetime']= pd.to_datetime(df['pickup_datetime'])
# получаем день заказа из стандартной даты и кладём его в новую колонку
df["Day"] = df["pickup_datetime"].apply(lambda x: x.day)
# точно так же получаем час
df["Hour"] = df["pickup_datetime"].apply(lambda x: x.hour)
# и номер дня недели
df["Weekday"] = df["pickup_datetime"].apply(lambda x: x.weekday())
# выводим первые 5 записей в новой таблице
print(df.head(5))
----------------------------
# Делаем визуализацию распределения вызовов в зависимости от дня недели где 0 это понедельник, а 6 — воскресенье:
# готовим холст
fig,ax = plt.subplots(figsize = (12,6))
# строим гистограмму распределения по дням недели
plt.hist(df.Weekday, width= 0.6, range= (0, 6.5), bins=7, color= "green")
# подписываем оси
plt.title("Распределение вызовов по дням недели", fontsize=16)
plt.xlabel("День недели", fontsize=14)
plt.ylabel("Плотность вызовов", fontsize=14)
# сохраняем картинку
plt.savefig('weekday.png', dpi=120)
-------------------------------
# Делаем визуализацию распределения вызовов в течение суток
# готовим холст
fig,ax = plt.subplots(figsize = (12,6))
# строим гистограмму распределения по часам
plt.hist(df.Hour, width= 0.6, bins=24, color= "orange")
# подписываем оси
plt.title("Распределение вызовов по часам", fontsize=16)
plt.xlabel("Часы", fontsize=14)
plt.ylabel("Плотность вызовов", fontsize=14)
# сохраняем картинку
plt.savefig('hours.png', dpi=120)
-----------------------------------
#Задание 3
df['hour'] = df['pickup_datetime'].dt.hour
df['month'] = df['pickup_datetime'].dt.month
 
# Группировка данных по месяцу и часу и подсчет среднего количества поездок
monthly_hourly_trip_counts = df.groupby(['month', 'hour'])['trip_counts'].mean().reset_index()
 
# Построение графика
plt.figure(figsize=(12, 6))
sns.lineplot(x='hour', y='trip_counts', hue='month', data=monthly_hourly_trip_counts, palette='viridis')
plt.xlabel('Часы в сутках')
plt.ylabel('Среднее количество поездок')
plt.title('Зависимость количества поездок от часа в сутках для разных месяцев')
plt.xticks(range(24))  # Отображаем все часы
plt.tight_layout()
 
# Подписи месяцев
month_labels = ['Jan','Feb','Mar','Apr','May','Jun','Jul','Aug','Sep','Oct','Nov','Dec']
plt.legend(title='Месяц', labels=month_labels)
 
plt.show()
----------------------------------------
df['day_of_week'] = df['pickup_datetime'].dt.dayofweek
 
# Группировка данных по дню недели и часу и подсчет среднего количества поездок
daily_hourly_trip_counts = df.groupby(['day_of_week', 'hour'])['trip_counts'].mean().reset_index()
 
# Построение графика
plt.figure(figsize=(12, 6))
sns.lineplot(x='hour', y='trip_counts', hue='day_of_week', data=daily_hourly_trip_counts, palette='viridis')
plt.xlabel('Часы в сутках')
plt.ylabel('Среднее количество поездок')
plt.title('Зависимость количества поездок от часа в сутках для разных дней недели')
 
# Подписи дней недели
days_of_week_labels = ['Пн', 'Вт', 'Ср', 'Чт', 'Пт', 'Сб', 'Вс']
plt.legend(title='День недели', labels=days_of_week_labels)
 
plt.xticks(range(24))  # Отображаем все часы
plt.tight_layout()
plt.show()
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
19.10.2023, 18:19
Ответы с готовыми решениями:

Машинное обучение
вот допустим заполненность емкости в литрах и в процентах 120л - 60% 140л - 70% 150л - 75% 180л - x% по математике посчитать...

Сканер, 3d, измерение дистанции, машинное зрение
Народ, подскажите пожалуйста. Предположим есть своего рода такой манипулятор https://www.youtube.com/watch?v=bAdqazixuRY Вопрос в...

Задача 4: Обучение шахматам
Задача 4: Обучение шахматам Маленькая Ева только учится играть в шахматы. Сегодня она узнала, как слон ходит по шахматной доске....

2
5515 / 2868 / 571
Регистрация: 07.11.2019
Сообщений: 4,757
21.10.2023, 19:56
ничего не понял, но очень интересно..
1
Нарушитель
110 / 86 / 32
Регистрация: 10.05.2023
Сообщений: 323
21.10.2023, 20:23
Так-то выглядит все нормально, от нас то что требуется? Похлопать?))
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
21.10.2023, 20:23
Помогаю со студенческими работами здесь

Задача 4: Обучение шахматам
Маленькая Ева только учится играть в шахматы. Сегодня она узнала, как слон ходит по шахматной доске. Теперь она хочет понять, куда слон...

Машинное обучение
Приветствую всех Делаю проект по биометрической верификации, только начал погружаться в машинное обучение, поэтому в интернете нахватался...

Машинное Обучение
Доброго времени суток уважаемые читатели, хочу услышать Ваше экспертное мнение в области машинного обучения. На данный момент есть много...

Машинное обучение
Здравствуйте. Прочитал на Хабре несколько статей по машинному обучению и решил немного попрактиковаться в этом деле. Есть набор...

Keras. Машинное обучение
Приветствую, занимаюсь проектом по машинному обучению и задался вопросом... Какой алгоритм обучения нейронных сетей использован при...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Опции темы

Новые блоги и статьи
Новый CodeBlocs. Версия 25.03
palva 04.01.2026
Оказывается, недавно вышла новая версия CodeBlocks за номером 25. 03. Когда-то давно я возился с только что вышедшей тогда версией 20. 03. С тех пор я давно снёс всё с компьютера и забыл. Теперь. . .
Модель микоризы: классовый агентный подход
anaschu 02.01.2026
Раньше это было два гриба и бактерия. Теперь три гриба, растение. И на уровне агентов добавится между грибами или бактериями взаимодействий. До того я пробовал подход через многомерные массивы,. . .
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru