Форум программистов, компьютерный форум, киберфорум
Python: Научные вычисления
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.89/9: Рейтинг темы: голосов - 9, средняя оценка - 4.89
0 / 0 / 0
Регистрация: 02.02.2013
Сообщений: 25

Метод k ближайших соседей

08.06.2020, 18:34. Показов 1958. Ответов 6

Студворк — интернет-сервис помощи студентам
Начинаю первые шаги в машинном обучении. Хочу но просто получить ответ - а понять что я делаю и как считаю

Разъясните, пожалуйста, вот по такому заданию: методом k ближайших соседей и выбор в нем параметра k

Дано: работать с базой вин (файлы приложены в сообщении).
Итак, пункт задания
2. Извлеките из данных признаки и классы. Класс записан в первом столбце (три варианта), признаки — в столбцах со второго по последний.
Я сделал так:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
import numpy as np
import pandas as pd
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score
 
data = pd.read_csv('wine.data', header=None)
 
X = data.iloc[:, 1:14]
y = data.iloc[:, 0]
 
print(X.head()) # чтобы видеть полученные данные
print(y.head()) # чтобы видеть полученные данные
А вот на следующем шаге (шаг 3) я застрял - пожалуйста поясните смысл действий
3. Оценку качества необходимо провести методом кросс-валидации по 5 блокам (5-fold). Создайте генератор разбиений, который перемешивает выборку перед формированием блоков (shuffle=True). Для воспроизводимости результата, создавайте генератор KFold с фиксированным параметром random_state=42. В качестве меры качества используйте долю верных ответов (accuracy).
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
import numpy as np
import pandas as pd
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score
 
data = pd.read_csv('wine.data', header=None)
 
X = data.iloc[:, 1:14]
y = data.iloc[:, 0]
 
print(X.head()) # чтобы видеть полученные данные
print(y.head()) # чтобы видеть полученные данные
 
kf = KFold(n_splits=5, shuffle=True, random_state=42)
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
08.06.2020, 18:34
Ответы с готовыми решениями:

Метод к-ближайших соседей
Всем привет, столкнулся с такой проблемой. Имеются координаты точек, которые описывают некое состояние системы. Нужно отобразить их в...

Метод ближайших соседей в машинном обучении
Добрый день. Опытные аналитики данных помогите понять и реализовать в код задание. Используется класс...

Метод ближайших соседей отрисовка
Здравствуйте. Как можно наглядно (визуально) отобразить работу метода ближайших соседей. Сформировал из датасета тренировочные данные...

6
0 / 0 / 0
Регистрация: 02.02.2013
Сообщений: 25
11.06.2020, 16:26  [ТС]
Неужели никто не знает, как выполнить это: В качестве меры качества используйте долю верных ответов (accuracy).
0
578 / 411 / 69
Регистрация: 09.01.2018
Сообщений: 1,363
11.06.2020, 17:06
Да не, думаю всем неудобно писать ответ на вопрос, если его можно найти в один клик самостоятельно в документации пакета.

Импортируем

from sklearn.metrics import accuracy_score
пользуем и сравниваем результаты.
0
0 / 0 / 0
Регистрация: 02.02.2013
Сообщений: 25
12.06.2020, 07:12  [ТС]
Вот так не работает:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
import numpy as np
import pandas as pd
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score
from sklearn.metrics import accuracy_score
 
data = pd.read_csv('wine.data', header=None)
 
X = data.iloc[:, 1:14]
y = data.iloc[:, 0]
 
print(X.head()) # чтобы видеть полученные данные
print(y.head()) # чтобы видеть полученные данные
 
kf = KFold(n_splits=5, shuffle=True, random_state=42)
accuracy_score(X, y)
0
578 / 411 / 69
Регистрация: 09.01.2018
Сообщений: 1,363
12.06.2020, 10:52
Ну вы хоть раз документацию-то откройте. А то даже неудобно как-то рассказывать, что KFold - никакого обучения модели не производит. Ни сам, ни kfold.split(), а только готовят данные. А уж как вы использовали accuracy_score - это вообще песня.
0
0 / 0 / 0
Регистрация: 02.02.2013
Сообщений: 25
12.06.2020, 12:25  [ТС]
Цитата Сообщение от passant Посмотреть сообщение
Ну вы хоть раз документацию-то откройте. А то даже неудобно как-то рассказывать, что KFold - никакого обучения модели не производит. Ни сам, ни kfold.split(), а только готовят данные. А уж как вы использовали accuracy_score - это вообще песня.
Я пытаюсь выполнить, то о чём пишется в задании:
Оценку качества необходимо провести методом кросс-валидации по 5 блокам (5-fold). Создайте генератор разбиений, который перемешивает выборку перед формированием блоков (shuffle=True). Для воспроизводимости результата, создавайте генератор KFold с фиксированным параметром random_state=42. В качестве меры качества используйте долю верных ответов (accuracy).
Я создал генератор KFold. Про обучение в пункте 3 нет ни слова. Поэтому изначально я и стал задавать вопрос.
0
578 / 411 / 69
Регистрация: 09.01.2018
Сообщений: 1,363
12.06.2020, 14:43
Рад, что натолкнул вас на правильное решение.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
12.06.2020, 14:43
Помогаю со студенческими работами здесь

Метод ближайших соседей
здравствуйте, помогите, пожалуйста! мне нужно найти Евклидово расстояние, но не между 2 точками, а от 3 до 15... не могли бы...

метод k ближайших соседей
дайте ссылку на литературу где описан это метод

Метод Kn ближайших соседей
Есть пример задания который нужно сделать 1. Задать точки 2. Отобразить их в пространстве 3. Отобразить неизвестную точку 4. И...

Метод k-ближайших соседей
Необходимо реализовать один из методов для решения задачи классификации статистических данных: метод опорных векторов или же метод k...

Метод ближайших соседей
Здравствуйте. Помогите составить алгоритм для Метода ближайших соседей распознавания образов. То есть по пунктам 1. генерируем данные...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
7
Ответ Создать тему
Новые блоги и статьи
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит переходные токи и напряжения на элементах схемы. . . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru