Форум программистов, компьютерный форум, киберфорум
Python: Научные вычисления
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.89/9: Рейтинг темы: голосов - 9, средняя оценка - 4.89
0 / 0 / 0
Регистрация: 02.02.2013
Сообщений: 25

Метод k ближайших соседей

08.06.2020, 18:34. Показов 2017. Ответов 6

Студворк — интернет-сервис помощи студентам
Начинаю первые шаги в машинном обучении. Хочу но просто получить ответ - а понять что я делаю и как считаю

Разъясните, пожалуйста, вот по такому заданию: методом k ближайших соседей и выбор в нем параметра k

Дано: работать с базой вин (файлы приложены в сообщении).
Итак, пункт задания
2. Извлеките из данных признаки и классы. Класс записан в первом столбце (три варианта), признаки — в столбцах со второго по последний.
Я сделал так:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
import numpy as np
import pandas as pd
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score
 
data = pd.read_csv('wine.data', header=None)
 
X = data.iloc[:, 1:14]
y = data.iloc[:, 0]
 
print(X.head()) # чтобы видеть полученные данные
print(y.head()) # чтобы видеть полученные данные
А вот на следующем шаге (шаг 3) я застрял - пожалуйста поясните смысл действий
3. Оценку качества необходимо провести методом кросс-валидации по 5 блокам (5-fold). Создайте генератор разбиений, который перемешивает выборку перед формированием блоков (shuffle=True). Для воспроизводимости результата, создавайте генератор KFold с фиксированным параметром random_state=42. В качестве меры качества используйте долю верных ответов (accuracy).
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
import numpy as np
import pandas as pd
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score
 
data = pd.read_csv('wine.data', header=None)
 
X = data.iloc[:, 1:14]
y = data.iloc[:, 0]
 
print(X.head()) # чтобы видеть полученные данные
print(y.head()) # чтобы видеть полученные данные
 
kf = KFold(n_splits=5, shuffle=True, random_state=42)
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
08.06.2020, 18:34
Ответы с готовыми решениями:

Метод к-ближайших соседей
Всем привет, столкнулся с такой проблемой. Имеются координаты точек, которые описывают некое состояние системы. Нужно отобразить их в...

Метод ближайших соседей в машинном обучении
Добрый день. Опытные аналитики данных помогите понять и реализовать в код задание. Используется класс...

Метод ближайших соседей отрисовка
Здравствуйте. Как можно наглядно (визуально) отобразить работу метода ближайших соседей. Сформировал из датасета тренировочные данные...

6
0 / 0 / 0
Регистрация: 02.02.2013
Сообщений: 25
11.06.2020, 16:26  [ТС]
Неужели никто не знает, как выполнить это: В качестве меры качества используйте долю верных ответов (accuracy).
0
578 / 411 / 69
Регистрация: 09.01.2018
Сообщений: 1,363
11.06.2020, 17:06
Да не, думаю всем неудобно писать ответ на вопрос, если его можно найти в один клик самостоятельно в документации пакета.

Импортируем

from sklearn.metrics import accuracy_score
пользуем и сравниваем результаты.
0
0 / 0 / 0
Регистрация: 02.02.2013
Сообщений: 25
12.06.2020, 07:12  [ТС]
Вот так не работает:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
import numpy as np
import pandas as pd
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score
from sklearn.metrics import accuracy_score
 
data = pd.read_csv('wine.data', header=None)
 
X = data.iloc[:, 1:14]
y = data.iloc[:, 0]
 
print(X.head()) # чтобы видеть полученные данные
print(y.head()) # чтобы видеть полученные данные
 
kf = KFold(n_splits=5, shuffle=True, random_state=42)
accuracy_score(X, y)
0
578 / 411 / 69
Регистрация: 09.01.2018
Сообщений: 1,363
12.06.2020, 10:52
Ну вы хоть раз документацию-то откройте. А то даже неудобно как-то рассказывать, что KFold - никакого обучения модели не производит. Ни сам, ни kfold.split(), а только готовят данные. А уж как вы использовали accuracy_score - это вообще песня.
0
0 / 0 / 0
Регистрация: 02.02.2013
Сообщений: 25
12.06.2020, 12:25  [ТС]
Цитата Сообщение от passant Посмотреть сообщение
Ну вы хоть раз документацию-то откройте. А то даже неудобно как-то рассказывать, что KFold - никакого обучения модели не производит. Ни сам, ни kfold.split(), а только готовят данные. А уж как вы использовали accuracy_score - это вообще песня.
Я пытаюсь выполнить, то о чём пишется в задании:
Оценку качества необходимо провести методом кросс-валидации по 5 блокам (5-fold). Создайте генератор разбиений, который перемешивает выборку перед формированием блоков (shuffle=True). Для воспроизводимости результата, создавайте генератор KFold с фиксированным параметром random_state=42. В качестве меры качества используйте долю верных ответов (accuracy).
Я создал генератор KFold. Про обучение в пункте 3 нет ни слова. Поэтому изначально я и стал задавать вопрос.
0
578 / 411 / 69
Регистрация: 09.01.2018
Сообщений: 1,363
12.06.2020, 14:43
Рад, что натолкнул вас на правильное решение.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
12.06.2020, 14:43
Помогаю со студенческими работами здесь

Метод ближайших соседей
здравствуйте, помогите, пожалуйста! мне нужно найти Евклидово расстояние, но не между 2 точками, а от 3 до 15... не могли бы...

метод k ближайших соседей
дайте ссылку на литературу где описан это метод

Метод Kn ближайших соседей
Есть пример задания который нужно сделать 1. Задать точки 2. Отобразить их в пространстве 3. Отобразить неизвестную точку 4. И...

Метод k-ближайших соседей
Необходимо реализовать один из методов для решения задачи классификации статистических данных: метод опорных векторов или же метод k...

Метод ближайших соседей
Здравствуйте. Помогите составить алгоритм для Метода ближайших соседей распознавания образов. То есть по пунктам 1. генерируем данные...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
7
Ответ Создать тему
Новые блоги и статьи
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои. А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20% kYBz3eJf3jQ
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
Горе от ума
kumehtar 07.04.2026
Эта мне ментальная установка, что вот прямо сейчас, мол, мне для полного счастья не хватает (нужное вписать), и когда я этого достигну - тогда и полный кайф. Одна из самых сильных ловушек на пути. . . .
Использование значений реквизитов справочника в документе, с определенными условиями и правами
Maks 07.04.2026
1. Контроль срока действия договора Алгоритм из решения ниже реализован на примере нетипового документа "ЗаявкаНаРаботу", разработанного в конфигурации КА2. Задача: уведомлять пользователя, если. . .
Доступность команды формы по условию
Maks 07.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: сделать доступной кнопку (команда формы "ЗавершитьСписание") при. . .
Уведомление о неверно выбранном значении справочника
Maks 06.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "НарядПутевка", разработанного в конфигурации КА2. Задача: уведомлять пользователя, если в документе выбран неверный склад. . .
Установка Qt Creator для C и C++: ставим среду, CMake и MinGW без фреймворка Qt
8Observer8 05.04.2026
Среду разработки Qt Creator можно установить без фреймворка Qt. Есть отдельный репозиторий для этой среды: https:/ / github. com/ qt-creator/ qt-creator, где можно скачать установщик, на вкладке Releases:. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru