Форум программистов, компьютерный форум, киберфорум
Python: Научные вычисления
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.95/120: Рейтинг темы: голосов - 120, средняя оценка - 4.95
17 / 17 / 6
Регистрация: 10.12.2013
Сообщений: 740

Как работает функция train_test_split?

09.05.2018, 14:00. Показов 21975. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Привет всем.

Пытаюсь реализовать полную кросс-валидацию. Написал такой код:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
import numpy as np
import math
from sklearn import svm
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.model_selection import cross_val_score
 
iris = datasets.load_iris()
clf = svm.SVC(kernel='linear', C=1)
 
def fullCV():
    k = 1
    L = len(iris.data)
    N = math.factorial(L) / (math.factorial(k) * math.factorial(L - k))
    N = int(N)
    
    scores = np.zeros((N,))
 
    for i in range(N):
        X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.01, random_state=250)
 
        clf.fit(X_train, y_train)
 
        y_pred = clf.predict(X_test)
 
        sum = 0
 
        for j in range(len(X_test)):
            if y_pred[j] != y_test[j]:
                sum += 1
 
        Q = sum / len(X_test)
        
        scores[i] = Q
        
    print('Full cross validation:')
    print(scores)
    
    print('\nMean score:')
    print(scores.mean(), '\n')
По идее, функция train_test_split при каждом проходе цикла должна формировать различные выборки из-за random_state. Но каждый раз выборки получаются одни и те же. То есть, к примеру, если N = 150 и test_size = 0.01, то формируются 150 одинаковых массивов X_test и y_test.

Где тут моя ошибка? Как это исправить?
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
09.05.2018, 14:00
Ответы с готовыми решениями:

Проблема с train_test_split
Благодаря train_test_split данные делятся спокойно, но при попытке обучить дерево решений на одном из полученных массивах программа выдает...

Как функция работает,в обработчике не работает
В таком виде все прекрасно работает (function ($) { $.fn.percent = function (el, arg2) { ...

Как работает функция в с++?
Здравствуйте,я только учусь с++ и тут же у меня вопрос как работает функция? что возвращает return?Куда возвращает?

2
1741 / 913 / 480
Регистрация: 05.12.2013
Сообщений: 3,074
09.05.2018, 14:39
длина X_test и y_test 148, а вы задаете random_state=250, уменьшите random_state раз в 10 и все пойдет
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
09.05.2018, 14:45
random_state : int, RandomState instance or None, optional (default=None)

If int, random_state is the seed used by the random number generator; If RandomState instance, random_state is the random number generator; If None, the random number generator is the RandomState instance used by np.random.
Коротко: если указываете число в random_state - генератор будет всегда выдавать одно и тоже состояние на одно и тоже число. Это нужно для точной фиксации результатов работы модели.
Если указывает None - генератор будет инициализироваться случайным значением и конечное состояние не будет детерминированным. Выборки будут случайными, а модель выдавать разные результаты.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
09.05.2018, 14:45
Помогаю со студенческими работами здесь

Как работает функция?
Добрый день! Уважаемые программисты! Помогите разобраться с функцией, как она работает. Или подскажите какими средствами ее...

как работает функция?
void non_ori_adjacency_to_incidence(vector<vector<int>> non_ori_adjacency) { vector <vector <int>> temp; bool symmetrical = true; ...

Как работает функция?
Можете пожалуйста объяснить как работает функция fillingFunction. Буду очень благодарен! #include <stdio.h> #include...

Как работает функция
Объясните пожалуйста как работает функция галереи, а то я не догоняю чего то. <script type="text/javascript"> ...

Как работает функция
$res1 = file_get_contents('...'); $res2 = file_get_contents('...'); Вопрос, эти функции начинают работать одновремено? Или сначало...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка. Рецензия / Мнение/ Перевод https:/ / **********/ gallery/ thinkpad-x220-tablet-porn-gzoEAjs . . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru