Форум программистов, компьютерный форум, киберфорум
Python: Научные вычисления
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.65/55: Рейтинг темы: голосов - 55, средняя оценка - 4.65
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1

Конвертация изображения средствами numpy

07.03.2018, 22:08. Показов 10618. Ответов 7

Студворк — интернет-сервис помощи студентам
Нашел вот такое задание на форуме
без питоновских циклов сконвертируйте цветное изображение в черно-белое по формуле:

C = 0.2989 * R + 0.5870 * G + 0.1140 * B
На самое деле по этой формуле получается grayscale - оттенки серого, но суть не в этом.
Как это сделать на pure python - понятно. К тому же легко гуглятся примеры на хабре.
Однако, попытка написать такое же преобразование чисто на numpy (плюс PIL для открытия изображения) дала код, который работает не то чтобы медленно... ужасно медленно. В 10 раз медленнее, чем с python циклами.
Стало интересно, а можно ли вообще написать нормально работающую реализацию, следуя этому заданию?
Для сравнения также использован пример чисто на встроенных функциях PIL (grayscale_pillow), который работает так и должно все работать.
Вот замеры работы всех функций:

Code
1
2
3
4
grayscale           :8.58449101448059
grayscale pillow    :0.08200454711914062
grayscale_numpy     :75.70432996749878
black_white         :7.205412149429321
Из всех функций в numpy более-менее подходящей показалась apply_along_axis.
Но именно она - при использование моей функции apply_gray для каждого пикселя - работает крайне неэффективно.
Если кто-то захочет разобраться почему так и как написать правильно, смотрите код.

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
import time
import random
import os
from PIL import Image, ImageDraw
import numpy as np
import matplotlib.image as mplimg
 
#-----------------------------------------------
#def load_image_mpl(filename):
#    return mplimg.imread(filename)
 
 
def load_image(filename):
    image = Image.open(filename)
    draw = ImageDraw.Draw(image) # кисть для рисования; не нужна, если использовать putpixel
    pixels = image.load() # загрузка пикселей; <class 'PixelAccess'>
    return image, draw, pixels
 
def save_image(image,filename,postfix='gray'):
    name,ext = os.path.splitext(filename)
    image.save("{}_{}{}".format(name,postfix,ext), "JPEG")
 
# оттенки серого
def grayscale(filename):
    image, draw, pixels = load_image(filename)
    width = image.size[0]  # ширина 
    height = image.size[1] # высота
    
    for i in range(width):
        for j in range(height):
            R,G,B = pixels[i, j] #R,G,B = image.getpixel((i, j)) # через getpixel почему-то медленнее
            #S = (R + G + B) // 3 # другая (более грубая) формула  grayscale
            S = round(0.2989 * R + 0.587 * G + 0.114 * B)
            #draw.point((i, j), (S, S, S))
            image.putpixel((i, j), (S, S, S)) # так быстрее чем через draw
    
    del draw            
    return image  
 
# черно-белое
def black_white(filename,factor=1):
    image, draw, pixels = load_image(filename)
    width = image.size[0]  # ширина 
    height = image.size[1] # высота
    
    for i in range(width):
        for j in range(height):
            R,G,B = pixels[i, j]
            S = R + G + B
            if (S > (((255 + factor) // 2) * 3)):
                R, G, B = 255, 255, 255
            else:
                R, G, B = 0, 0, 0
            
            #draw.point((i, j), (R, G, B))
            image.putpixel((i, j), (R, G, B)) 
    
    del draw        
    return image
 
#-----------------------------------------
def apply_gray(rgb):
    coeff = np.array([0.2989, 0.587 , 0.114 ])
    #S = np.round(0.2989 * rgb[0] + 0.587 * rgb[1] + 0.114 * rgb[2])
    #rgb = np.array([S,S,S],dtype="uint8")
    S = np.round(np.sum(rgb * coeff))
    rgb = np.array([S,S,S],dtype="uint8")
    return rgb
 
 
def grayscale_numpy(filename):
    image,_,_ = load_image(filename)
    data = np.asarray(image, dtype="uint8")
    data = np.apply_along_axis(apply_gray, 2, data)
    return data
 
 
def grayscale_pillow(filename):
    image, draw, pixels = load_image(filename)
    return image.convert('L')
 
if __name__ == "__main__":
    filename="tiger.jpg"
    
    start = time.time()
    image = grayscale(filename)
    save_image(image,filename,postfix='gray') 
    print('{:20}:{}'.format('grayscale',time.time() - start))
    
    start = time.time()
    image = grayscale_pillow(filename)
    save_image(image,filename,postfix='gray2') 
    print('{:20}:{}'.format('grayscale pillow',time.time() - start))
    
    
    start = time.time()
    data = grayscale_numpy(filename)
    image = Image.fromarray(data, "RGB")
    save_image(image,filename,postfix='gray3')
    print('{:20}:{}'.format('grayscale_numpy',time.time() - start))
    
    start = time.time()
    image = black_white(filename)
    save_image(image,filename,postfix='black_white')
    print('{:20}:{}'.format('black_white',time.time() - start))
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
07.03.2018, 22:08
Ответы с готовыми решениями:

Работа с матрицами средствами NumPy
Помогите пожалуйста с написанием... 1) Импортируйте numpy. 2) Создайте матрицу (2D-массив) случайных действительных чисел (тип с...

Построчный обход двумерного массива без цикла средствами Numpy
Здравствуйте. Дан двумерный массив. В каждой строке необходимо найти минимальное значение и занести в новый массив. Т.е. элементами...

Представление изображения в виде массива NumPy
Здравствуйте стоит следующая задача, необходимо представить изображение в виде двумерного массива, в каждой ячейке которого хранятся данные...

7
277 / 226 / 93
Регистрация: 27.06.2016
Сообщений: 639
07.03.2018, 23:06
Лучший ответ Сообщение было отмечено Garry Galler как решение

Решение

Garry Galler, у numpy вообще говоря каноничное использование - это всячески операции векторизовать.
Вот что я смог выжать постаравшись не напрягаться:
Python
1
2
3
4
5
6
7
8
9
def grayscale_numpy(filename):
    image, _, _ = load_image(filename)
    data = np.asarray(image, dtype="uint8")
 
    coeff = np.array([[[0.2989, 0.587, 0.114]]])
    sums = np.round(np.sum(coeff * data, axis = 2)).astype(np.uint8)
    data = np.repeat(sums, 3).reshape(data.shape)
 
    return data

grayscale :0.2801399230957031
grayscale pillow :0.006412506103515625
grayscale_numpy :0.01502847671508789
black_white :0.22236919403076172
1
1741 / 913 / 480
Регистрация: 05.12.2013
Сообщений: 3,074
07.03.2018, 23:22
Почему-то результат grey2, явно отличается от результатов gray и gray3
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
08.03.2018, 00:01  [ТС]
Цитата Сообщение от alex white Посмотреть сообщение
numpy вообще говоря каноничное использование - это всячески операции векторизовать.
Да, точно. Неверный подход был с apply_along_axis. Бесполезно было надеяться, что попиксельно будет работать быстро, даже в numpy, но я думал, что apply_along_axis умеет делать магию.
В общем все классно :-). Работает на моем проце, конечно, медленнее, чем в вашем бенчмарке, но хотя бы раз в 8 быстрее, чем в pure python.
-----------------------------------
Цитата Сообщение от ТабуретY Посмотреть сообщение
Почему-то результат grey2, явно отличается от результатов gray и gray3
Это о каких результатах?

Добавлено через 12 минут
То что через через Image.convert быстрее? Так в PIL своя реализация grayscale - уже на чисто на С наверно.
1
1741 / 913 / 480
Регистрация: 05.12.2013
Сообщений: 3,074
08.03.2018, 00:02
Цитата Сообщение от Garry Galler Посмотреть сообщение
Это о каких результатах?
Взял картинку в формате jpg, назвал tiger, запустил скрипт, получились еще 4 картинки
tiger_black_white.jpg
tiger_gray.jpg
tiger_gray2.jpg
tiger_gray3.jpg
Почему-то tiger_gray2 отличается от tiger_gray и tiger_gray3, но я уже нашел почему, цветность tiger_gray2 стала 8 бит, а у остальных осталась 24
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
08.03.2018, 14:40  [ТС]
Цитата Сообщение от ТабуретY Посмотреть сообщение
tiger_gray2 стала 8 бит
Да, в доках PIL так и написано, что режим "L" возвращает 8-bit pixels.
------------------------------------------------------------------------------------------
Дополню варианты преобразования в grayscale:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
# Вариант alex white
def rgb2gray0(data):
    coeff = np.array([[[0.2989, 0.587, 0.114]]])
    sums = np.round(np.sum(coeff * data, axis = 2)).astype(np.uint8)
    data = np.repeat(sums, 3).reshape(data.shape)
    return data
 
def rgb2gray1(data):
    r, g, b = data[:,:,0], data[:,:,1], data[:,:,2]
    sums = np.round(0.2989 * r + 0.587 * g + 0.114 * b).astype(np.uint8)
    data = np.repeat(sums, 3).reshape(data.shape)
    return data
 
def rgb2gray2(data):
    #sums = np.dot(data,np.array([0.2989, 0.587, 0.114]))
    sums = data @ np.array([0.2989, 0.587, 0.114]) # через  __matmul__ быстрее чем dot
    sums = np.round(sums).astype(np.uint8)
    data = np.repeat(sums, 3).reshape(data.shape)
    return data
Последние два чуть-чуть быстрее:
Code
1
2
3
grayscale_numpy     (rgb2gray0):0.8510487079620361
grayscale_numpy     (rgb2gray1):0.8060460090637207
grayscale_numpy     (rgb2gray2):0.7650439739227295
1
Просто Лис
Эксперт Python
 Аватар для Рыжий Лис
5973 / 3735 / 1099
Регистрация: 17.05.2012
Сообщений: 10,791
Записей в блоге: 9
10.03.2018, 14:21
Garry Galler, проверь на скорость этот вариант:

Python
1
2
3
4
def rgb2gray3(data):
    x, y, _ = data.shape
    k = np.array([[[0.2989, 0.587, 0.114]]])
    return np.round(np.sum(data*k, axis=2)).astype(np.uint8).reshape((x, y))
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
10.03.2018, 15:01  [ТС]
Цитата Сообщение от Рыжий Лис Посмотреть сообщение
проверь на скорость этот вариант
Проверил.

Code
1
2
3
4
grayscale_numpy     (rgb2gray0):0.8300013542175293
grayscale_numpy     (rgb2gray1):0.7500016689300537
grayscale_numpy     (rgb2gray2):0.7400014400482178
grayscale_numpy     (rgb2gray3):0.7600016593933105
Результаты чуть разнятся при перезапусках, но видно, что варианты 1, 2, 3 мало отличаются.
Единственная серьезная разница - rgb2gray3 дает 8-битное изображение, раз мы не делаем np.repeat(sums, 3).
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
10.03.2018, 15:01
Помогаю со студенческими работами здесь

Конвертация цветного изображения в черно-белое
Используя numpy, без питоновских циклов сконвертируйте цветное изображение в черно-белое по формуле: C = 0.2989 * R + 0.5870 * G +...

Как сохранить numpy массив в виде изображения, что бы при повторном переводе в массив не было различий
Я решил попробовать записывать информацию в изображение, путем изменения последней цифры каждого цвета (RGB) пикселя. Изображение перевожу...

Пример кодирования изображения BMP в JPG средствами Python
Добрый день коллеги Возникла проблема, сыну, второкурснику задали задание, которое звучит примерно так: &quot;Вот как файл...

Конвертация csv в xml средствами php
Доброго времени. Подскажите как корректно сконвертировать файл CSV в формат XML. Есть файл на входе вида: Марка Модель ...

Конвертация doc/docx документов в HTML средствами PHPWord
Или другими способами; Есть годный мануал?


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Работа со звуком через SDL3_mixer
8Observer8 08.02.2026
Содержание блога Пошагово создадим проект для загрузки звукового файла и воспроизведения звука с помощью библиотеки SDL3_mixer. Звук будет воспроизводиться по клику мышки по холсту на Desktop и по. . .
SDL3 для Web (WebAssembly): Основы отладки веб-приложений на SDL3 по USB и Wi-Fi, запущенных в браузере мобильных устройств
8Observer8 07.02.2026
Содержание блога Браузер Chrome имеет средства для отладки мобильных веб-приложений по USB. В этой пошаговой инструкции ограничимся работой с консолью. Вывод в консоль - это часть процесса. . .
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru