С Новым годом! Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/3: Рейтинг темы: голосов - 3, средняя оценка - 5.00
0 / 0 / 0
Регистрация: 28.02.2024
Сообщений: 16

Pipeline

07.06.2024, 14:42. Показов 740. Ответов 8
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Доброго всем дня!

Знаю, что поможете.
Ниже код, в котором ошибка, но где не могу понять...
Помогите исправить

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
import pandas as pd
from sklearn.model_selection import cross_val_score
from sklearn.preprocessing import OneHotEncoder
from sklearn.preprocessing import StandardScaler
from sklearn.ensemble import RandomForestClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from sklearn.impute import SimpleImputer
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import FunctionTransformer
from sklearn.pipeline import Pipeline
from sklearn.compose import make_column_selector
 
df = pd.read_csv('homework.csv')
 
def filter_data(df):
    columns_to_drop = [
       'id',
       'url',
       'region',
       'region_url',
       'price',
       'manufacturer',
       'image_url',
       'description',
       'posting_date',
       'lat',
       'long']
    return df.drop(columns_to_drop, axis=1)
 
def calculate_outliers(df):
    q25 = df['year'].quantile(0.25)
    q75 = df['year'].quantile(0.75)
    iqr = q75 - q25
    df.loc[df['year'] < (q25 - 1.5 * iqr), 'year'] = round(q25 - 1.5 * iqr)
    df.loc[df['year'] > (q75 + 1.5 * iqr), 'year'] = round(q25 + 1.5 * iqr)
    return df['year']
 
 
def new_predictor(df):
    df.loc[:, 'age_category'] = df['year'].apply(lambda x: 'new' if x > 2013 else ('old' if x < 2006 else 'average'))
    df.loc[:, 'short_model'] = df.apply(lambda x: x.model.split(' ')[0], axis=1)
    return df
 
 
def filter_data2(df):
    columns_to_drop = [
        'year',
        'model',
        'fuel',
        'odometer',
        'title_status',
        'transmission',
        'short_model',
        'state',
        'age_category']
    return df.drop(columns_to_drop, axis=1)
 
 
models = (
    LogisticRegression(solver='liblinear'),
    RandomForestClassifier(),
    SVC()
)
 
 
imputer_transformer = Pipeline(steps=[
        ('imputer1', SimpleImputer(strategy='median'), make_column_selector(dtype_include=['int64', 'float64'])),
        ('imputer2', SimpleImputer(strategy='most_frequent'), make_column_selector(dtype_include=object))
    ])
 
encode_scale_transformer = Pipeline(steps=[
        ('scaler', StandardScaler(), make_column_selector(dtype_include=['int64', 'float64'])),
        ('encode', OneHotEncoder(handle_unknown='ignore'), make_column_selector(dtype_include=object))
    ])
 
 
X = df.drop(['price_category'], axis=1)
Y = df['price_category']
 
for model in models:
    pipe = Pipeline(steps=[
        ('filter', FunctionTransformer(filter_data)),
        ('outliers', FunctionTransformer(calculate_outliers)),
        ('imputer_transformer', imputer_transformer),
        ('predictors', FunctionTransformer(new_predictor)),
        ('encode_scale_transformer', encode_scale_transformer),
        ('filter_2', FunctionTransformer(filter_data2)),
        ('classifier', model)
    ])
 
    score = cross_val_score(pipe, X, Y, cv=4, scoring='accuracy')
    print(f'model:{type(model).__name__}, acc_mean: {score.mean():.4f}, acc_std:{score.std():.4f}')
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
07.06.2024, 14:42
Ответы с готовыми решениями:

OpenGL 4.2 Pipeline map: Texture pipeline в чем отличие Fetch Texel от Garher?
Пытаюсь разобраться в основах работы конвеера opengl, поэтому случаю набрел на вот такую цацку. Таблица в части OpenGL 4.2 Texture...

Артефакты из предыдущего pipeline
Всем привет! Подскажите пожалуйста: как получить доступ до артефактов с помощью кэша из предыдущего пайплайна (в пределах одного бранча)....

MultiTexture in Fixed Pipeline
Добра всем! Есть квад с мультитекстурой. Проблема в том что я никак не могу подобрать нужные параметры в TexEnv для смешивания. Хочу...

8
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,664
Записей в блоге: 29
07.06.2024, 16:10
нет ошибки, все верно работает, результат в норме
0
0 / 0 / 0
Регистрация: 28.02.2024
Сообщений: 16
07.06.2024, 16:55  [ТС]
не может быть)

у меня ошибка

ValueError: too many values to unpack (expected 2)
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,664
Записей в блоге: 29
07.06.2024, 17:11
AntonKLD, и ты посчитал эту информацию излишней? Этого текста и номера строки достаточн чтобы понять проблему. Как ты перевел ошибку?
2
0 / 0 / 0
Регистрация: 28.02.2024
Сообщений: 16
07.06.2024, 20:33  [ТС]
Эта ошибка о том, что слишком много переменных для распаковки значений.

Как видно , не достаточно, чтобы понять....
0
1709 / 578 / 74
Регистрация: 10.04.2009
Сообщений: 9,297
08.06.2024, 05:48
AntonKLD,
Ошибка ValueError: слишком много значений для распаковки (ожидается 2) означает, что вы пытаетесь распаковать последовательность (например, список или кортеж) в фиксированное количество переменных, но последовательность содержит больше элементов, чем количество переменных.
1
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,664
Записей в блоге: 29
08.06.2024, 08:26
AntonKLD, вон даже Эндрю понял - ты в 2 переменные пытаешься положить большее количество значений, например 3 (5, 10, 100), элементарная проблема. Смотрим номер строки, внимательно смотрим на нее саму, включаем отладчик и смотрим почему туда пришло больше, чем 2 значения. Или думаем - а почему я распаковываю это только в 2 переменные?
0
1709 / 578 / 74
Регистрация: 10.04.2009
Сообщений: 9,297
08.06.2024, 09:29
AntonKLD, а подсказывать именно в вашем коде - его нужно пробовать, а там полно импортов - то есть вряд ли кому будет охота этим заниматься.....
0
0 / 0 / 0
Регистрация: 28.02.2024
Сообщений: 16
08.06.2024, 11:15  [ТС]
Эх, очень жаль.....
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
08.06.2024, 11:15
Помогаю со студенческими работами здесь

Вакансия CI/CD Pipeline Engineer
Bell Integrator - это крупная IT компания аутсорсинговая. Мы разрабатываем сложные и инновационные решения для нужд IT и бизнеса наших...

Разница между pipeline и middleware
Смотрю видео уроки по Asp.NET Core и слышу такие слова как pipeline и middleware и слово pipeline меня сбивает с толку. Объясните простыми...

Дозатор для pipeline-оператора
Собственно, предлагаю обсудить тут очевидную идею дозированного pipeline оператора | и отослать её в Америка-наш для согласования. В...

PipeLine, перенос базы из Excel в MySQL
Добрый день! На текущий момент на работе используется Pipe Line в эксель формате. Есть идея реализовать его в виде Вэб страницы,...

Создание простого CI PIPELINE для GitLab
Привет. Я погуглил и почитал про GitLab, и если я правильно понял, то в CI PIPELINE могут быть включены например такие стадии: ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
9
Ответ Создать тему
Новые блоги и статьи
Модель микоризы: классовый агентный подход
anaschu 02.01.2026
Раньше это было два гриба и бактерия. Теперь три гриба, растение. И на уровне агентов добавится между грибами или бактериями взаимодействий. До того я пробовал подход через многомерные массивы,. . .
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути
Programma_Boinc 01.01.2026
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути Сочетание глобально распределённой вычислительной мощности и инновационных. . .
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru