Заблокирован

Не выводится медиана из Series Pandas

27.10.2022, 12:59. Показов 1476. Ответов 6
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Не выводится медиана из списка из Series Pandas. Делаю в Google Collab.
Код:
Python
1
price_column_series.median()
Ошибка:
ValueError Traceback (most recent call last)
/usr/local/lib/python3.7/dist-packages/pandas/core/nanops.py in nanmedian(values, axis, skipna, mask)
719 try:
--> 720 values = values.astype("f8")
721 except ValueError as err:

ValueError: could not convert string to float: '$387,000 '

The above exception was the direct cause of the following exception:

TypeError Traceback (most recent call last)
6 frames
/usr/local/lib/python3.7/dist-packages/pandas/core/nanops.py in nanmedian(values, axis, skipna, mask)
721 except ValueError as err:
722 # e.g. "could not convert string to float: 'a'"
--> 723 raise TypeError(str(err)) from err
724 if mask is not None:
725 values[mask] = np.nan

TypeError: could not convert string to float: '$387,000 '
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
27.10.2022, 12:59
Ответы с готовыми решениями:

Удаление выбросов из Series pandas
Добрый день! Подскажите пожалуйста, есть вот такая функция: def outliers(row): q_1 = np.quantile(row, 0.25) q_3 =...

Изменить индекс объекта Series библиотеки pandas
Код: series = pandas.Series(numpy.random.randint(-10000, 10001, 1000)) Выводит: 0 8853 1 -9598 2 9991 3 ...

Pandas: подсчет количества уникальных значений в Series
Подскажите, пожалуйста, как посчитать количество уникальных значений (каждого отдельно) в колонке датафрейм. В коде показал через метод...

6
150 / 120 / 36
Регистрация: 01.11.2019
Сообщений: 425
27.10.2022, 13:10
Лучший ответ Сообщение было отмечено nikulin_artyom1 как решение

Решение

Написано же, не удалось преобразовать строку в значение с плавающей запятой. Надо убрать знак "$" и ",". Привести весь столбец в числовой формат и после этого можно производить вычислительные операции.
1
Заблокирован
27.10.2022, 13:21  [ТС]
volkomorov, только как убрать знаки "$", "," и сделать числовой формат?
Пробовал метод replace и не получилось
Добавлено через 24 секунды
забыл добавить делаю это из файла csv
0
150 / 120 / 36
Регистрация: 01.11.2019
Сообщений: 425
27.10.2022, 14:20
Лучший ответ Сообщение было отмечено nikulin_artyom1 как решение

Решение

1 вариант:
https://pandas.pydata.org/pand... place.html

2 вариант использовать lambda функцию:
Python
1
df['column_name'].map(lambda x: x.replace("$", '').replace(",", ''))
Преобразовать в числовой формат: https://pandas.pydata.org/pand... meric.html
2
Заблокирован
27.10.2022, 18:24  [ТС]
volkomorov, Спасибо! Сейчас попробую

Добавлено через 30 минут
volkomorov, лишние символы убрал.
Python
1
2
3
4
without_symbols=price_column_series.map(lambda x: x.replace("$", '').replace(",", '') \
                        .replace("£", '').replace("€", '') \
                        .replace("USD ", '').replace("Price: ", ''))
without_symbols.median()
сейчас другая проблема:
ValueError: could not convert string to float: 'NEW'
The above exception was the direct cause of the following exception:

Добавлено через 42 минуты
volkomorov, Всё заработало! я забыл про numeric
0
150 / 120 / 36
Регистрация: 01.11.2019
Сообщений: 425
27.10.2022, 18:39
Лучший ответ Сообщение было отмечено nikulin_artyom1 как решение

Решение

Ошибка осталась прежняя, "NEW" не может конвертироваться в число с плавающей точкой. Если так много мусора, то лучше пройтись регуляркой, как то так:

Python
1
2
3
4
5
6
7
8
9
10
11
import re
 
# Пишу без программы, могут быть ошибки
def price(x):
    x = re.findall('\w+', x)
        if x == []
            return 0 # Если нет цифр вернет 0
        else:
            return x[0]
 
without_symbols=price_column_series.map(lambda x: price(x))
ps: А вообще лучше бы файл увидеть
1
Заблокирован
27.10.2022, 21:50  [ТС]
volkomorov, я как раз сделал replace для new, used, usd, и других символов. Выше сообщение не дописал. Медиана, макс и мин считаются. Ещё раз Спасибо!
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
27.10.2022, 21:50
Помогаю со студенческими работами здесь

Добавить 0 если нет индекса в Series pandas
Здравствуйте! Есть следующий набор индексов: Есть Series: X1 220 X4 70 X2 70 L 3200 Подскажите,...

Как отсортировать объект Series в pandas по значениям?
Я знаю, что для сортировки по значению Series используется order(), но почему-то у меня в версии python 3.6 пишет, что мол Series не имеет...

HP M600 Series и HP P4000 Series. Совместимость модулей двухсторонней печати
Доброго времени суток! Приобрел принтер HP M601n, да проглядел, что он без дуплекса (автоматической двухсторонней печати). Стал искать,...

Две линейки модулей DDR3 памяти - HyperX Beast Series и HyperX Black Series
Калифорнийская сompany Kingston Technology, крупнейший независимый разработчик, производитель и поставщик разнообразных устройств памяти...

Медиана
Основание треугольника равно 23 ,а медианы боковых сторон - 15 и 22.5 .Найти 3-ю медиану.


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
7
Ответ Создать тему
Опции темы

Новые блоги и статьи
Отчёт о спецтехнике находящейся в ремонте
Maks 20.04.2026
Отчёт из решения ниже размещен в конфигурации КА2. Задача: отобразить спецтехнику, которая на данный момент находится в ремонте. Есть нетиповой документ "Заявка на ремонт спецтехники" который. . .
Памятка для бота и "визитка" для читателей "Semantic Universe Layer (Слой семантической вселенной)"
Hrethgir 19.04.2026
Сгенерировано для краткого описания по случаю сборки и компиляции скелета серверного приложения. И пусть после этого скажут, что статьи сгенерированные AI - туфта и не интересно. И это не реклама -. . .
Запрет удаления строк ТЧ документа при определенном условии
Maks 19.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "Аккумуляторы", разработанного в конфигурации КА2. У данного документа есть ТЧ, в которой в зависимости от прав доступа. . .
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут Суть: - Группа наркоманов из 10 человек. - Только один инфицирован ВИЧ. - Колются одной иглой. - Колются раз в день. - Колются последовательно через. . .
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . . а удачный момент так и не приходит.
Фиксация колонок в отчете СКД
Maks 14.04.2026
Фиксация колонок в СКД отчета типа Таблица. Задача: зафиксировать три левых колонки в отчете. Процедура ПриКомпоновкеРезультата(ДокументРезультат, ДанныеРасшифровки, СтандартнаяОбработка) / / . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru