Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
24 / 5 / 0
Регистрация: 20.09.2018
Сообщений: 310

Обучение датасета

03.05.2019, 15:15. Показов 2679. Ответов 0
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Дан обучающий сет с численными признаками. Дополнительно известно, что целевая функция f : R100 —> R линейная и гарантированно зависит от всех признаков. Требуется найти целевую функцию.
Решение будет зачтено, если абсолютная ошибка на каждом примере не превышает 10^(-8).
test.tsv.zip

train.tsv.zip
Формат ввода
Обучающий датасет train.tsv
Формат данных: в каждой строке содержатся значения 100 признаков. 101-е число в каждой строке — значение целевой функции на этом наборе.
Тестовый датасет test.tsv
Формат данных: в каждой строке содержатся значения 100 признаков.
Каждый признак в датасетах. а также значение целевой функции — число с точностью 8 значащих цифр после десятичной точки.
Формат вывода
Необходимо предоставить файл answer.tsv. в котором в i-той строке будет записано предсказанное значение функции (число с точностью 8 значащих цифр после десятичной точки) для i-той строки тестового датасета.
Мое решение:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
all_data = pd.read_tsv('...train.tsv ') #путь к данным
all_data.head()
labels = all_data[all_data.columns[-1]].values   #Выделим значения метки класса в переменную labels, признаковые описания в переменную feature_matrix. Так как данные числовые и не имеют пропусков, переведем их в numpy-формат с помощью метода .values.
feature_matrix = all_data[all_data.columns[:-1]].values
train_feature_matrix, test_feature_matrix, train_labels, test_labels = train_test_split(feature_matrix, labels, test_size=0.2,random_state=42) #Разделим выборку на обучающую и тестовую с помощью метода train_test_split
# создание модели с указанием гиперпараметра C
clf = LogisticRegression(C=1)
# обучение модели
clf.fit(train_feature_matrix, train_labels)
# предсказание на тестовой выборке
y_pred = clf.predict(test_feature_matrix)
#измерить качество нашей модели. Для этого можно использовать метод score(X, y), который посчитает какую-то функцию ошибки на выборке 

		
		
		
		
		
		
			
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
03.05.2019, 15:15
Ответы с готовыми решениями:

Обучение по видео
Всем привет! Смотрю обучающие видео и переписал всё символ в символ, в итоге ошибка. На видео конечно же все работает. пробовал написать...

Обучение Python
Всем привет! Народ, я в python абсолютный новичек, но хочу написать телеграм-бота. Порекомендуйте норм курсы или литературу, чтобы...

Обучение программированию
Начал обучение программированию, как первый язык выбрал Python. Подскажите пожалуйста с чего лучше стоит начинать.

0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
03.05.2019, 15:15
Помогаю со студенческими работами здесь

Обучение программированию
Привет всем. Кто может подсказать, где можно или кто может обучить программированию?

Обучение перцептрона
Здравствуйте! Нужна ваша помощь в реализации алгоритма на Python или c++.

Самостоятельное обучение программированию
Здравствуйте! Работаю электриком, но нравится программирование. Подскажите, как продуктивнее учиться самостоятельно программированию....

Неправильное открытие датасета
при открытии некоторых файлов все значения в них равны NaN. с большинством файлов этого не происходит, но встречаются исключения. пробовал...

Анализ датасета, создание модели
Всем привет, не могу справиться с заданием по анализу датасета, необходимо создать модель, которая будет предсказывать размер дохода...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
1
Ответ Создать тему
Новые блоги и статьи
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru