Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.86/7: Рейтинг темы: голосов - 7, средняя оценка - 4.86
15 / 13 / 3
Регистрация: 20.02.2018
Сообщений: 446

В каком формате (виде) должны быть обучающие данные для keras

11.02.2020, 20:46. Показов 1652. Ответов 2

Студворк — интернет-сервис помощи студентам
Ребята, здравствуйте!

Сразу прошу прощения за наверное элементарный вопрос, но в питоне не бум-бум, а машинное обучение в инсте на нем.

Подскажите пожалуйста в каком формате должны быть данные, что бы их можно было с помощью методов keras разбить на обучающею и тесовую часть?

Использую для разбития вот этот метод:
Python
1
(x_train, y_train), (x_test, y_test) = boston_housing.load_data(factors,resolve)
Данные передаю вот в таком виде:
Factors:
[['0' '1' '2' ... '149' '150' '151']
['2.8' '0.6' '13.4' ... '0' '0' '0']
['0' '0' '0' ... '0' '0' '0']
...
['0.5' '0.5' '0.5' ... '0' '0' '0']
['0' '2.1' '0' ... '0' '0' '0']
['208' '208' '208' ... '0' '0' '0']]
Ressolve:
[0 0 0 ... 0 0 0]
Выдает ошибку:
File "C:\Users\Vladimir\Anaconda3\envs\krs\li b\site-packages\keras\datasets\boston_housing.p y", line 24, in load_data
assert 0 <= test_split < 1

ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()
Вот этим алгоритмом пытаюсь все запустить:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
from keras.datasets import boston_housing
from keras.models import Sequential
from keras.layers import Dense
import openpyxl
import numpy as np
 
#Для начала загрузим библиотеку и выберем нужную книгу и рабочий лист:
wb = openpyxl.load_workbook(filename = 'E:/Fast_Water_project/Gidrolodge_.xlsx')
sheet_oren = wb['Onb']
 
def Not_None (x):
    if x!=None:
        return x
    else:
        return 0
    
#считываем заданный диапазон
factor_days = [Not_None(v[0].value) for v in sheet_oren['E2':'E1126']]
factor_osadky = [Not_None(v[0].value) for v in sheet_oren['F2':'F1126']]
factor_level_snow = [Not_None(v[0].value) for v in sheet_oren['G2':'G1126']]
factor_chandge_lvl_snow = [Not_None(v[0].value) for v in sheet_oren['H2':'H1126']]
factor_reserv_water = [Not_None(v[0].value) for v in sheet_oren['I2':'I1126']]
factor_frez_ground = [Not_None(v[0].value) for v in sheet_oren['J2':'J1126']]
factor_ice = [Not_None(v[0].value) for v in sheet_oren['K2':'K1126']]
factor_max_t = [Not_None(v[0].value) for v in sheet_oren['L2':'L1126']]
factor_min_t = [Not_None(v[0].value) for v in sheet_oren['M2':'M1126']]
factor_humidity = [Not_None(v[0].value) for v in sheet_oren['N2':'N1126']]
factor_deficit_humidity = [Not_None(v[0].value) for v in sheet_oren['O2':'O1126']]
factor_solar = [Not_None(v[0].value) for v in sheet_oren['P2':'P1126']]
factor_level_water = [Not_None(v[0].value) for v in sheet_oren['Q2':'Q1126']]
resolve_chandge_lvl_water = [Not_None(v[0].value) for v in sheet_oren['R2':'R1126']]
 
factors_list=list()
resolve_list=list()
factors_list.append(factor_days)
factors_list.append(factor_osadky)
factors_list.append(factor_level_snow)
factors_list.append(factor_chandge_lvl_snow)
factors_list.append(factor_reserv_water)
factors_list.append(factor_frez_ground)
factors_list.append(factor_ice)
factors_list.append(factor_max_t)
factors_list.append(factor_min_t)
factors_list.append(factor_humidity)
factors_list.append(factor_deficit_humidity)
factors_list.append(factor_solar)
factors_list.append(factor_level_water)
resolve_list=[x for x in resolve_chandge_lvl_water]
 
factors=np.array(factors_list)
resolve=np.array(resolve_list)
 
#(x_train, y_train), (x_test, y_test) = boston_housing.load_data(factors,resolve)
 
#Нормализация данных
#Вычитаем среднее значение и делим на стандартное отклонение
# Среднее значение
mean = x_train.mean(axis=0)
 Стандартное отклонение
 std = x_train.std(axis=0)
 x_train -= mean
 x_train /= std
 x_test -= mean
 x_test /= std
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
11.02.2020, 20:46
Ответы с готовыми решениями:

В каком виде должны быть записаны вопросы и ответы в файле для программы тестирования
Здравствуйте. у меня есть код программы, но для того, чтобы она работала надо записать вопрос и ответ в текстовом документе. Покажи...

Данные должны быть представлены в виде структуры
Создать файл содержащий сведения о результатах охоты. Данные должны быть представлены в виде следующей структуры: фамилия охотника; ...

Данные о читателях должны быть организованны в виде хеш-таблицы
Данные о каждом читателе должны содержать: № читательского билета – строка формата «ANNNN-YY», где A – буква, обозначающая права доступа...

2
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
11.02.2020, 23:09
Keras как любая библиотека для ML понимает исключительно чиселки. А у вас там в списочках строчечки...
И насчет boston_housing - вы документацию вообще прочитали?
tf.keras.datasets.boston_housing.load_da ta(
path='boston_housing.npz',
test_split=0.2,
seed=113
)
Добавлено через 2 минуты
прогнозирование цен на дома

Добавлено через 2 минуты
Цитата Сообщение от Volodya_ Посмотреть сообщение
но в питоне не бум-бум, а машинное обучение в инсте на нем
Вот и нечего тогда браться...
1
15 / 13 / 3
Регистрация: 20.02.2018
Сообщений: 446
12.02.2020, 20:58  [ТС]
Цитата Сообщение от Garry Galler Посмотреть сообщение
Вот и нечего тогда браться...
А курсовую-то сдать надо )

Цитата Сообщение от Garry Galler Посмотреть сообщение
И насчет boston_housing - вы документацию вообще прочитали?
Честно - нет, времени не хватает. Нужно как всегда было сделать уже вчера) А на питоне вообще не писал до этого

А какой мне для данных из Excel метод подойдет для разбития и дальнейшей нормализации?
В интернете видел только примеры с данными из внешних источников.

Добавлено через 3 часа 28 минут
Подскажите пожалуйста способ (желательно керовский) для разбития данных из Excel на обучающею и тестовые выборки для keras?
В интернете видел только примеры с данными из внешних источников уже в нужном формате.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
12.02.2020, 20:58
Помогаю со студенческими работами здесь

В поле данные не должны превышать значения другого поля и должны быть не менее 0
У меня в задаче магазин и нужно добавить в таблицу поле с кол-вом товара на складе. Условие: кол-во товара не должно превышать кол-во...

Есть таблица в MYSQL. Там данные не должны повторяться, типа не должны быть дубликаты
но при этом введенное должно сохранится. Например, есть 2 таблицы, в первой статьи, во второй категории статей. Статьи разделены на...

Почему данные должны быть нормально распределенными для линейной регрессии?
Какие свойства линейной регрессии подразумевают, что данные должны быть нормальными?

В текстовый файл result.txt должны быть выведены результаты в следующем формате
Добрый день нужна помощь с задачей Дана функция, вычисляющая значение переменной y в зависимости от переменной x. Дан интервал целых...

В каком виде лучше подавать данные для своего класса диаграммы
В каком виде лучше подавать данные для своего класса диаграммы (столбчатой)? В виде словаря IDictionary&lt;string,...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
Отправка уведомления на почту при изменении наименования справочника
Maks 24.03.2026
Программная отправка письма электронной почты на примере изменения наименования типового справочника "Склады" в конфигурации БП3. Перед реализацией необходимо выполнить настройку системной учетной. . .
модель ЗдравоСохранения 5. Меньше увольнений- больше дохода!
anaschu 24.03.2026
Теперь система здравосохранения уменьшает количество увольнений. 9TO2GP2bpX4 a42b81fb172ffc12ca589c7898261ccb/ https:/ / rutube. ru/ video/ a42b81fb172ffc12ca589c7898261ccb/ Слева синяя линия -. . .
Midnight Chicago Blues
kumehtar 24.03.2026
Такой Midnight Chicago Blues, знаешь?. . Когда вечерние улицы становятся ночными, а ты не можешь уснуть. Ты идёшь в любимый старый бар, и бармен наливает тебе виски. Ты смотришь на пролетающие. . .
SDL3 для Desktop (MinGW): Вывод текста со шрифтом TTF с помощью библиотеки SDL3_ttf на Си и C++
8Observer8 24.03.2026
Содержание блога Финальные проекты на Си и на C++: finish-text-sdl3-c. zip finish-text-sdl3-cpp. zip
Жизнь в неопределённости
kumehtar 23.03.2026
Жизнь — это постоянное существование в неопределённости. Например, даже если у тебя есть список дел, невозможно дойти до точки, где всё окончательно завершено и больше ничего не осталось. В принципе,. . .
Модель здравоСохранения: работники работают быстрее после её введения.
anaschu 23.03.2026
geJalZw1fLo Корпорация до введения программа здравоохранения имела много невыполненных работниками заданий, после введения программы количество заданий выросло. Но на выплатах по больничным это. . .
Контроль уникальности заводского номера
Maks 23.03.2026
Алгоритм контроля уникальности заводского (или серийного) номера на примере нетипового документа выдачи шин для спецтехники с табличной частью, разработанного в конфигурации КА2. Данные берутся из. . .
Хочу заставить корпорации вкладываться в здоровье сотрудников: делаю мат модель здравосохранения
anaschu 22.03.2026
e7EYtONaj8Y Z4Tv2zpXVVo https:/ / github. com/ shumilovas/ med2. git
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru