В каком формате (виде) должны быть обучающие данные для keras

@Volodya_ · Регистрация: 20.02.2018

Студворк — интернет-сервис помощи студентам

Ребята, здравствуйте!

Сразу прошу прощения за наверное элементарный вопрос, но в питоне не бум-бум, а машинное обучение в инсте на нем.

Подскажите пожалуйста в каком формате должны быть данные, что бы их можно было с помощью методов keras разбить на обучающею и тесовую часть?

Использую для разбития вот этот метод:

Python
1
(x_train, y_train), (x_test, y_test) = boston_housing.load_data(factors,resolve)

Данные передаю вот в таком виде:

Factors:
[['0' '1' '2' ... '149' '150' '151']
['2.8' '0.6' '13.4' ... '0' '0' '0']
['0' '0' '0' ... '0' '0' '0']
...
['0.5' '0.5' '0.5' ... '0' '0' '0']
['0' '2.1' '0' ... '0' '0' '0']
['208' '208' '208' ... '0' '0' '0']]
Ressolve:
[0 0 0 ... 0 0 0]

Выдает ошибку:

File "C:\Users\Vladimir\Anaconda3\envs\krs\li b\site-packages\keras\datasets\boston_housing.p y", line 24, in load_data
assert 0 <= test_split < 1

ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()

Вот этим алгоритмом пытаюсь все запустить:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
from keras.datasets import boston_housing
from keras.models import Sequential
from keras.layers import Dense
import openpyxl
import numpy as np
 
#Для начала загрузим библиотеку и выберем нужную книгу и рабочий лист:
wb = openpyxl.load_workbook(filename = 'E:/Fast_Water_project/Gidrolodge_.xlsx')
sheet_oren = wb['Onb']
 
def Not_None (x):
    if x!=None:
        return x
    else:
        return 0
    
#считываем заданный диапазон
factor_days = [Not_None(v[0].value) for v in sheet_oren['E2':'E1126']]
factor_osadky = [Not_None(v[0].value) for v in sheet_oren['F2':'F1126']]
factor_level_snow = [Not_None(v[0].value) for v in sheet_oren['G2':'G1126']]
factor_chandge_lvl_snow = [Not_None(v[0].value) for v in sheet_oren['H2':'H1126']]
factor_reserv_water = [Not_None(v[0].value) for v in sheet_oren['I2':'I1126']]
factor_frez_ground = [Not_None(v[0].value) for v in sheet_oren['J2':'J1126']]
factor_ice = [Not_None(v[0].value) for v in sheet_oren['K2':'K1126']]
factor_max_t = [Not_None(v[0].value) for v in sheet_oren['L2':'L1126']]
factor_min_t = [Not_None(v[0].value) for v in sheet_oren['M2':'M1126']]
factor_humidity = [Not_None(v[0].value) for v in sheet_oren['N2':'N1126']]
factor_deficit_humidity = [Not_None(v[0].value) for v in sheet_oren['O2':'O1126']]
factor_solar = [Not_None(v[0].value) for v in sheet_oren['P2':'P1126']]
factor_level_water = [Not_None(v[0].value) for v in sheet_oren['Q2':'Q1126']]
resolve_chandge_lvl_water = [Not_None(v[0].value) for v in sheet_oren['R2':'R1126']]
 
factors_list=list()
resolve_list=list()
factors_list.append(factor_days)
factors_list.append(factor_osadky)
factors_list.append(factor_level_snow)
factors_list.append(factor_chandge_lvl_snow)
factors_list.append(factor_reserv_water)
factors_list.append(factor_frez_ground)
factors_list.append(factor_ice)
factors_list.append(factor_max_t)
factors_list.append(factor_min_t)
factors_list.append(factor_humidity)
factors_list.append(factor_deficit_humidity)
factors_list.append(factor_solar)
factors_list.append(factor_level_water)
resolve_list=[x for x in resolve_chandge_lvl_water]
 
factors=np.array(factors_list)
resolve=np.array(resolve_list)
 
#(x_train, y_train), (x_test, y_test) = boston_housing.load_data(factors,resolve)
 
#Нормализация данных
#Вычитаем среднее значение и делим на стандартное отклонение
# Среднее значение
mean = x_train.mean(axis=0)
 Стандартное отклонение
 std = x_train.std(axis=0)
 x_train -= mean
 x_train /= std
 x_test -= mean
 x_test /= std

@Garry Galler · 11.02.2020, 23:09

Keras как любая библиотека для ML понимает исключительно чиселки. А у вас там в списочках строчечки...
И насчет boston_housing - вы документацию вообще прочитали?

tf.keras.datasets.boston_housing.load_da ta(
path='boston_housing.npz',
test_split=0.2,
seed=113
)

Добавлено через 2 минуты
прогнозирование цен на дома

Добавлено через 2 минуты

Сообщение от Volodya_

но в питоне не бум-бум, а машинное обучение в инсте на нем

Вот и нечего тогда браться...

@Volodya_ · 12.02.2020, 20:58 **[ТС]**

Сообщение от Garry Galler

Вот и нечего тогда браться...

А курсовую-то сдать надо )

Сообщение от Garry Galler

И насчет boston_housing - вы документацию вообще прочитали?

Честно - нет, времени не хватает. Нужно как всегда было сделать уже вчера) А на питоне вообще не писал до этого

А какой мне для данных из Excel метод подойдет для разбития и дальнейшей нормализации?
В интернете видел только примеры с данными из внешних источников.

Добавлено через 3 часа 28 минут
Подскажите пожалуйста способ (желательно керовский) для разбития данных из Excel на обучающею и тестовые выборки для keras?
В интернете видел только примеры с данными из внешних источников уже в нужном формате.

Новые блоги и статьи Все статьи Все блоги /
Отправка уведомления на почту при изменении наименования справочника Maks 24.03.2026 Программная отправка письма электронной почты на примере изменения наименования типового справочника "Склады" в конфигурации БП3. Перед реализацией необходимо выполнить настройку системной учетной. . .	модель ЗдравоСохранения 5. Меньше увольнений- больше дохода! anaschu 24.03.2026 Теперь система здравосохранения уменьшает количество увольнений. 9TO2GP2bpX4 a42b81fb172ffc12ca589c7898261ccb/ https:/ / rutube. ru/ video/ a42b81fb172ffc12ca589c7898261ccb/ Слева синяя линия -. . .	Midnight Chicago Blues kumehtar 24.03.2026 Такой Midnight Chicago Blues, знаешь?. . Когда вечерние улицы становятся ночными, а ты не можешь уснуть. Ты идёшь в любимый старый бар, и бармен наливает тебе виски. Ты смотришь на пролетающие. . .	SDL3 для Desktop (MinGW): Вывод текста со шрифтом TTF с помощью библиотеки SDL3_ttf на Си и C++ 8Observer8 24.03.2026 Содержание блога Финальные проекты на Си и на C++: finish-text-sdl3-c. zip finish-text-sdl3-cpp. zip
Жизнь в неопределённости kumehtar 23.03.2026 Жизнь — это постоянное существование в неопределённости. Например, даже если у тебя есть список дел, невозможно дойти до точки, где всё окончательно завершено и больше ничего не осталось. В принципе,. . .	Модель здравоСохранения: работники работают быстрее после её введения. anaschu 23.03.2026 geJalZw1fLo Корпорация до введения программа здравоохранения имела много невыполненных работниками заданий, после введения программы количество заданий выросло. Но на выплатах по больничным это. . .	Контроль уникальности заводского номера Maks 23.03.2026 Алгоритм контроля уникальности заводского (или серийного) номера на примере нетипового документа выдачи шин для спецтехники с табличной частью, разработанного в конфигурации КА2. Данные берутся из. . .	Хочу заставить корпорации вкладываться в здоровье сотрудников: делаю мат модель здравосохранения anaschu 22.03.2026 e7EYtONaj8Y Z4Tv2zpXVVo https:/ / github. com/ shumilovas/ med2. git