Форум программистов, компьютерный форум, киберфорум
Python: Научные вычисления
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.65/55: Рейтинг темы: голосов - 55, средняя оценка - 4.65
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1

Конвертация изображения средствами numpy

07.03.2018, 22:08. Показов 10570. Ответов 7

Студворк — интернет-сервис помощи студентам
Нашел вот такое задание на форуме
без питоновских циклов сконвертируйте цветное изображение в черно-белое по формуле:

C = 0.2989 * R + 0.5870 * G + 0.1140 * B
На самое деле по этой формуле получается grayscale - оттенки серого, но суть не в этом.
Как это сделать на pure python - понятно. К тому же легко гуглятся примеры на хабре.
Однако, попытка написать такое же преобразование чисто на numpy (плюс PIL для открытия изображения) дала код, который работает не то чтобы медленно... ужасно медленно. В 10 раз медленнее, чем с python циклами.
Стало интересно, а можно ли вообще написать нормально работающую реализацию, следуя этому заданию?
Для сравнения также использован пример чисто на встроенных функциях PIL (grayscale_pillow), который работает так и должно все работать.
Вот замеры работы всех функций:

Code
1
2
3
4
grayscale           :8.58449101448059
grayscale pillow    :0.08200454711914062
grayscale_numpy     :75.70432996749878
black_white         :7.205412149429321
Из всех функций в numpy более-менее подходящей показалась apply_along_axis.
Но именно она - при использование моей функции apply_gray для каждого пикселя - работает крайне неэффективно.
Если кто-то захочет разобраться почему так и как написать правильно, смотрите код.

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
import time
import random
import os
from PIL import Image, ImageDraw
import numpy as np
import matplotlib.image as mplimg
 
#-----------------------------------------------
#def load_image_mpl(filename):
#    return mplimg.imread(filename)
 
 
def load_image(filename):
    image = Image.open(filename)
    draw = ImageDraw.Draw(image) # кисть для рисования; не нужна, если использовать putpixel
    pixels = image.load() # загрузка пикселей; <class 'PixelAccess'>
    return image, draw, pixels
 
def save_image(image,filename,postfix='gray'):
    name,ext = os.path.splitext(filename)
    image.save("{}_{}{}".format(name,postfix,ext), "JPEG")
 
# оттенки серого
def grayscale(filename):
    image, draw, pixels = load_image(filename)
    width = image.size[0]  # ширина 
    height = image.size[1] # высота
    
    for i in range(width):
        for j in range(height):
            R,G,B = pixels[i, j] #R,G,B = image.getpixel((i, j)) # через getpixel почему-то медленнее
            #S = (R + G + B) // 3 # другая (более грубая) формула  grayscale
            S = round(0.2989 * R + 0.587 * G + 0.114 * B)
            #draw.point((i, j), (S, S, S))
            image.putpixel((i, j), (S, S, S)) # так быстрее чем через draw
    
    del draw            
    return image  
 
# черно-белое
def black_white(filename,factor=1):
    image, draw, pixels = load_image(filename)
    width = image.size[0]  # ширина 
    height = image.size[1] # высота
    
    for i in range(width):
        for j in range(height):
            R,G,B = pixels[i, j]
            S = R + G + B
            if (S > (((255 + factor) // 2) * 3)):
                R, G, B = 255, 255, 255
            else:
                R, G, B = 0, 0, 0
            
            #draw.point((i, j), (R, G, B))
            image.putpixel((i, j), (R, G, B)) 
    
    del draw        
    return image
 
#-----------------------------------------
def apply_gray(rgb):
    coeff = np.array([0.2989, 0.587 , 0.114 ])
    #S = np.round(0.2989 * rgb[0] + 0.587 * rgb[1] + 0.114 * rgb[2])
    #rgb = np.array([S,S,S],dtype="uint8")
    S = np.round(np.sum(rgb * coeff))
    rgb = np.array([S,S,S],dtype="uint8")
    return rgb
 
 
def grayscale_numpy(filename):
    image,_,_ = load_image(filename)
    data = np.asarray(image, dtype="uint8")
    data = np.apply_along_axis(apply_gray, 2, data)
    return data
 
 
def grayscale_pillow(filename):
    image, draw, pixels = load_image(filename)
    return image.convert('L')
 
if __name__ == "__main__":
    filename="tiger.jpg"
    
    start = time.time()
    image = grayscale(filename)
    save_image(image,filename,postfix='gray') 
    print('{:20}:{}'.format('grayscale',time.time() - start))
    
    start = time.time()
    image = grayscale_pillow(filename)
    save_image(image,filename,postfix='gray2') 
    print('{:20}:{}'.format('grayscale pillow',time.time() - start))
    
    
    start = time.time()
    data = grayscale_numpy(filename)
    image = Image.fromarray(data, "RGB")
    save_image(image,filename,postfix='gray3')
    print('{:20}:{}'.format('grayscale_numpy',time.time() - start))
    
    start = time.time()
    image = black_white(filename)
    save_image(image,filename,postfix='black_white')
    print('{:20}:{}'.format('black_white',time.time() - start))
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
07.03.2018, 22:08
Ответы с готовыми решениями:

Работа с матрицами средствами NumPy
Помогите пожалуйста с написанием... 1) Импортируйте numpy. 2) Создайте матрицу (2D-массив) случайных действительных чисел (тип с...

Построчный обход двумерного массива без цикла средствами Numpy
Здравствуйте. Дан двумерный массив. В каждой строке необходимо найти минимальное значение и занести в новый массив. Т.е. элементами...

Представление изображения в виде массива NumPy
Здравствуйте стоит следующая задача, необходимо представить изображение в виде двумерного массива, в каждой ячейке которого хранятся данные...

7
277 / 226 / 93
Регистрация: 27.06.2016
Сообщений: 639
07.03.2018, 23:06
Лучший ответ Сообщение было отмечено Garry Galler как решение

Решение

Garry Galler, у numpy вообще говоря каноничное использование - это всячески операции векторизовать.
Вот что я смог выжать постаравшись не напрягаться:
Python
1
2
3
4
5
6
7
8
9
def grayscale_numpy(filename):
    image, _, _ = load_image(filename)
    data = np.asarray(image, dtype="uint8")
 
    coeff = np.array([[[0.2989, 0.587, 0.114]]])
    sums = np.round(np.sum(coeff * data, axis = 2)).astype(np.uint8)
    data = np.repeat(sums, 3).reshape(data.shape)
 
    return data

grayscale :0.2801399230957031
grayscale pillow :0.006412506103515625
grayscale_numpy :0.01502847671508789
black_white :0.22236919403076172
1
1741 / 913 / 480
Регистрация: 05.12.2013
Сообщений: 3,074
07.03.2018, 23:22
Почему-то результат grey2, явно отличается от результатов gray и gray3
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
08.03.2018, 00:01  [ТС]
Цитата Сообщение от alex white Посмотреть сообщение
numpy вообще говоря каноничное использование - это всячески операции векторизовать.
Да, точно. Неверный подход был с apply_along_axis. Бесполезно было надеяться, что попиксельно будет работать быстро, даже в numpy, но я думал, что apply_along_axis умеет делать магию.
В общем все классно :-). Работает на моем проце, конечно, медленнее, чем в вашем бенчмарке, но хотя бы раз в 8 быстрее, чем в pure python.
-----------------------------------
Цитата Сообщение от ТабуретY Посмотреть сообщение
Почему-то результат grey2, явно отличается от результатов gray и gray3
Это о каких результатах?

Добавлено через 12 минут
То что через через Image.convert быстрее? Так в PIL своя реализация grayscale - уже на чисто на С наверно.
1
1741 / 913 / 480
Регистрация: 05.12.2013
Сообщений: 3,074
08.03.2018, 00:02
Цитата Сообщение от Garry Galler Посмотреть сообщение
Это о каких результатах?
Взял картинку в формате jpg, назвал tiger, запустил скрипт, получились еще 4 картинки
tiger_black_white.jpg
tiger_gray.jpg
tiger_gray2.jpg
tiger_gray3.jpg
Почему-то tiger_gray2 отличается от tiger_gray и tiger_gray3, но я уже нашел почему, цветность tiger_gray2 стала 8 бит, а у остальных осталась 24
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
08.03.2018, 14:40  [ТС]
Цитата Сообщение от ТабуретY Посмотреть сообщение
tiger_gray2 стала 8 бит
Да, в доках PIL так и написано, что режим "L" возвращает 8-bit pixels.
------------------------------------------------------------------------------------------
Дополню варианты преобразования в grayscale:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
# Вариант alex white
def rgb2gray0(data):
    coeff = np.array([[[0.2989, 0.587, 0.114]]])
    sums = np.round(np.sum(coeff * data, axis = 2)).astype(np.uint8)
    data = np.repeat(sums, 3).reshape(data.shape)
    return data
 
def rgb2gray1(data):
    r, g, b = data[:,:,0], data[:,:,1], data[:,:,2]
    sums = np.round(0.2989 * r + 0.587 * g + 0.114 * b).astype(np.uint8)
    data = np.repeat(sums, 3).reshape(data.shape)
    return data
 
def rgb2gray2(data):
    #sums = np.dot(data,np.array([0.2989, 0.587, 0.114]))
    sums = data @ np.array([0.2989, 0.587, 0.114]) # через  __matmul__ быстрее чем dot
    sums = np.round(sums).astype(np.uint8)
    data = np.repeat(sums, 3).reshape(data.shape)
    return data
Последние два чуть-чуть быстрее:
Code
1
2
3
grayscale_numpy     (rgb2gray0):0.8510487079620361
grayscale_numpy     (rgb2gray1):0.8060460090637207
grayscale_numpy     (rgb2gray2):0.7650439739227295
1
Просто Лис
Эксперт Python
 Аватар для Рыжий Лис
5972 / 3734 / 1099
Регистрация: 17.05.2012
Сообщений: 10,791
Записей в блоге: 9
10.03.2018, 14:21
Garry Galler, проверь на скорость этот вариант:

Python
1
2
3
4
def rgb2gray3(data):
    x, y, _ = data.shape
    k = np.array([[[0.2989, 0.587, 0.114]]])
    return np.round(np.sum(data*k, axis=2)).astype(np.uint8).reshape((x, y))
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
10.03.2018, 15:01  [ТС]
Цитата Сообщение от Рыжий Лис Посмотреть сообщение
проверь на скорость этот вариант
Проверил.

Code
1
2
3
4
grayscale_numpy     (rgb2gray0):0.8300013542175293
grayscale_numpy     (rgb2gray1):0.7500016689300537
grayscale_numpy     (rgb2gray2):0.7400014400482178
grayscale_numpy     (rgb2gray3):0.7600016593933105
Результаты чуть разнятся при перезапусках, но видно, что варианты 1, 2, 3 мало отличаются.
Единственная серьезная разница - rgb2gray3 дает 8-битное изображение, раз мы не делаем np.repeat(sums, 3).
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
10.03.2018, 15:01
Помогаю со студенческими работами здесь

Конвертация цветного изображения в черно-белое
Используя numpy, без питоновских циклов сконвертируйте цветное изображение в черно-белое по формуле: C = 0.2989 * R + 0.5870 * G +...

Как сохранить numpy массив в виде изображения, что бы при повторном переводе в массив не было различий
Я решил попробовать записывать информацию в изображение, путем изменения последней цифры каждого цвета (RGB) пикселя. Изображение перевожу...

Пример кодирования изображения BMP в JPG средствами Python
Добрый день коллеги Возникла проблема, сыну, второкурснику задали задание, которое звучит примерно так: &quot;Вот как файл...

Конвертация csv в xml средствами php
Доброго времени. Подскажите как корректно сконвертировать файл CSV в формат XML. Есть файл на входе вида: Марка Модель ...

Конвертация doc/docx документов в HTML средствами PHPWord
Или другими способами; Есть годный мануал?


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru