Форум программистов, компьютерный форум, киберфорум
OpenCL
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск  
 
 
Рейтинг 4.90/244: Рейтинг темы: голосов - 244, средняя оценка - 4.90
 Аватар для snake32
3578 / 1708 / 236
Регистрация: 26.02.2009
Сообщений: 8,615
Записей в блоге: 6

Производительность OpenCL

14.08.2014, 15:35. Показов 60565. Ответов 474
Метки нет (Все метки)

Доброго времени!
Написал тест для будущих расчётов с использованием OpenCL и проверил на разных системах:
( дрова для AMD 14.4; для nVidia 340.52 )

Radeon HD 7970(2048/925MHz; 384bit; 3Gb/5GHz) и CPU AMD 8120 справились за 4.3 секунды
GeForce GTX 760(1152/980MHz; 256bit; 4Gb/6GHz) и CPU Intel Q9450 справились за 22.5 секунд
GeForce GTS 450(192/750MHz; 128bit; 2Gb/??) и CPU Intel i7 2600 справились за 46.0 секунд
GeForce GT 520M(48/740MHz; 64bit; 2Gb/??) и CPU Intel 2630QM справились за 117.0 секунд

Интересен слив GTX 760 который оказался в 5,2 раза медленней(хотя по цене так не скажешь). Похоже дело в двойной точности(DP) которая у GeForce урезана маркетологами до 1/24 от производительности одинарной точности(SP). Хотя на титанах говорят оставили полную поддержку 1/3 как в Tesla'x(нужно включать спец галочку в дровах). У всех радиков вроде 1/2.
Ну и плюс к этому, наверное, сам OpenCL драйвер не лучшим образом реализован ибо есть своя CUDA, которая при всех остальных равных не нужна будет ни кому.

Поэтому интересуют тесты либо на более слабых радеонах, либо на топовых джифорсах. А лучше и те и те и побольше!
Ищутся счастливые обладатели карт и готовые скачать и запустить тест( ~30 Мбайт ):
GeForce GTX 780(с TI или без)
GeForce GTX TITAN(с BLACK EDITION или без)
Radeon R9 290( с Х или без ) - для этих карт наверно уже результат будет больше зависеть от CPU
Ну и любые другие радики не старше HD 7000.


https://cloud.mail.ru/public/f... L_TEST.rar
Распаковать архив полностью и запусить ехе
Обязательно укажите проц.
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
14.08.2014, 15:35
Ответы с готовыми решениями:

OpenCL на С++
Здравствуйте, уважаемые форумчани. Стоит задача написать знаменитую GameOfLife на С++ с использованием аппаратных средств видеокарты...

OpenCL на OS X
Ребят, помогите разобраться как начать работать с OpenCL на OS X? Не понимаю что и где надо скачать и поставить что бы начать работу.

Программа в OpenCL
Братцы, сроки поджимают и нужно закончить программульку одну. В общем, делал-делал и пришёл я к тупику на данном этапе... не знаю,...

474
дивананалитикаиксперд
 Аватар для K2K
15216 / 10907 / 914
Регистрация: 08.01.2013
Сообщений: 39,106
11.03.2016, 10:29
Цитата Сообщение от Linoge Посмотреть сообщение
По вычислениям 960 как половина 970
960 - это ровно половина 980, а у bobah16 970 при 1630МГц В общем, все по честному, без обмана.

i7 4770K @4.1 и 4.5ггц



Цитата Сообщение от Linoge Посмотреть сообщение
но появился 2 проц с нереальным результатом)
Кстати, результат от прогона к прогону, не так конечно но, слегка меняется.
0
Эксперт Hardware
 Аватар для Linoge
3205 / 1915 / 324
Регистрация: 25.10.2011
Сообщений: 5,566
11.03.2016, 10:34
Цитата Сообщение от K2K Посмотреть сообщение
Кстати, результат от прогона к прогону, не так конечно но, слегка меняется.
На вк стоит четко до последней ms.
А по процу логично, невозможно отлучить винду и прочее от него.
0
 Аватар для snake32
3578 / 1708 / 236
Регистрация: 26.02.2009
Сообщений: 8,615
Записей в блоге: 6
11.03.2016, 14:21  [ТС]
Цитата Сообщение от K2K Посмотреть сообщение
Кстати, результат от прогона к прогону, не так конечно но, слегка меняется.
Да, это может быть, но думаю не больше 0,5 секунд. Так что округлять можно смело до секунд

Думаю изменить доступ к памяти, чтобы хотя бы большинство используемых эл-тов данных в вычислителях/ядрах/кернелов физически находились в одном месте, таким образом эффективность кэша теоретически должна вырасти. А как на самом деле будет - посмотрим.
0
дивананалитикаиксперд
 Аватар для K2K
15216 / 10907 / 914
Регистрация: 08.01.2013
Сообщений: 39,106
21.07.2016, 09:34
snake32, i7 6700K и GTX1070

1
827 / 244 / 47
Регистрация: 24.01.2013
Сообщений: 750
31.03.2018, 10:57
Цитата Сообщение от K2K Посмотреть сообщение
i7 6700K и GTX1070
Интересно 8700 тут сколько покажет? в 10 секунд влезет?
0
Заблокирован
31.03.2018, 11:38
Цитата Сообщение от _Develop Посмотреть сообщение
Интересно 8700 тут сколько покажет? в 10 секунд влезет?
в стоке не показал
Миниатюры
Производительность OpenCL  
1
827 / 244 / 47
Регистрация: 24.01.2013
Сообщений: 750
31.03.2018, 12:01
dimank666, а Райзен 7 ?
по идее должен вписаться... если там конечно с векторными инструкциями все в порядке.
0
дивананалитикаиксперд
 Аватар для K2K
15216 / 10907 / 914
Регистрация: 08.01.2013
Сообщений: 39,106
31.03.2018, 13:00
Цитата Сообщение от _Develop Посмотреть сообщение
Интересно 8700 тут сколько покажет? в 10 секунд влезет?
Может, 8700K в разгоне и влезет

1
827 / 244 / 47
Регистрация: 24.01.2013
Сообщений: 750
31.03.2018, 13:02
K2K, ясно, спасибо.
0
Заблокирован
31.03.2018, 14:51
Цитата Сообщение от _Develop Посмотреть сообщение
а Райзен 7 ?
а райзин этот тест вообще не видит
0
827 / 244 / 47
Регистрация: 24.01.2013
Сообщений: 750
31.03.2018, 17:56
Цитата Сообщение от dimank666 Посмотреть сообщение
а райзин этот тест вообще не видит
Так надо драйвер для OpenCL накатить.

Обычно он с драйвером на видяху устанавливается, но если видяха и проц от разных вендоров, то нужен отдельно драйвер на проц. У меня, например, видяха от АМД, то пришлось скачивать "OpenCL™ Drivers and Runtimes for Intel®" для CPU.
Этот драйвер компилит код с использованием SSE и AVX инструкций.
0
 Аватар для snake32
3578 / 1708 / 236
Регистрация: 26.02.2009
Сообщений: 8,615
Записей в блоге: 6
31.03.2018, 18:12  [ТС]
Цитата Сообщение от dimank666 Посмотреть сообщение
а райзин этот тест вообще не видит
потому что дровишек OpenCL нет.

Поставь свежак от интела (40Мб)
https://software.intel.com/en-... PU_runtime
Не уверен что это поможет НО, я помню, ты на Фуфыкс ставил
0
Заблокирован
31.03.2018, 19:58
Цитата Сообщение от snake32 Посмотреть сообщение
потому что дровишек OpenCL нет.
поставил ваши дровишки все заработало
делал чрез тимвивер так что в живую будет лучше
Миниатюры
Производительность OpenCL  
0
Заблокирован
31.03.2018, 20:11
провел на чистую
Миниатюры
Производительность OpenCL  
1
 Аватар для snake32
3578 / 1708 / 236
Регистрация: 26.02.2009
Сообщений: 8,615
Записей в блоге: 6
31.03.2018, 20:19  [ТС]
Цитата Сообщение от dimank666 Посмотреть сообщение
делал чрез тимвивер
Кисловато для полноценных 8 ядер. На 1 сек быстрее моего 6700@4500
Кстати, галочка Цикл ускоряет 6700 на 2 секунды (18.8 vs 16.6)
0
Заблокирован
31.03.2018, 20:54
Цитата Сообщение от snake32 Посмотреть сообщение
Кисловато для полноценных 8 ядер. На 1 сек быстрее моего 6700@4500
надо сравнить с 2700 там частоты по боле будут, в этом тете частота решает

Если так судить то мой 8700К проходит этот тест на частоте 4300 я не обновлял на новый биус, где пофиксили тпд баг

если так судить
6700К@4500 набирает 16,7
8700К@4300 набирает 11,9

то 8700К на частоте 4500 должен меньше 9,0 набирать

ждем WyPik, с его 4,9 в турбо режиме
0
827 / 244 / 47
Регистрация: 24.01.2013
Сообщений: 750
31.03.2018, 21:03
Да это же интеловский драйвер OpenCL, может он код оптимизирует под ихнюю архитектуру.
Надо бы амд'ешный родной драйвер поискать... для чистоты эксперимента.
0
Форумчанин
5959 / 4193 / 406
Регистрация: 28.12.2013
Сообщений: 24,134
01.04.2018, 18:24
dimank666, у меня эта приблуда не видит проц,только карту.Да и шо тебе мешает разогнать свой?
0
Заблокирован
01.04.2018, 18:27
Цитата Сообщение от WyPik Посмотреть сообщение
у меня эта приблуда не видит проц
дрйавер поставь
0
Форумчанин
5959 / 4193 / 406
Регистрация: 28.12.2013
Сообщений: 24,134
01.04.2018, 18:28
dimank666, на проц?
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
01.04.2018, 18:28

Работа с OpenCL
Добрый вечер уважаемые форумчане, не мог бы кто нибудь помочь вводным курсом в opencl? Есть задача: сравнить скорость выпонения программы в...

Где скачать OpenCL C++?
Здравствуйте. Где скачать OpenCL C++? Если тут https://www.khronos.org/opencl/ есть, то скажите пожалуйста как скачать. Не нашел...

OpenCL в Builder и не только
Все добрый день! На данный момент встала проблема анализа огромного массива данных, времени неделя, а скорость обработки очень мала......

Глобальная переменная в OpenCL
Всем привет! Кто может подсказать как правильно создать глобальную переменную в OpenCL? unsigned char *globalVariable; __kernel...

OpenCL - ошибка 0xc0000005
Есть прога и использованием OpenCL - модель солнечной системы Проблема одна - чем больше частиц, тем быстрее вылетает в разных частях...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
80
Ответ Создать тему
Новые блоги и статьи
Программа для com-порта
Uhbif79 05.06.2026
Всем привет, давно хотел изучить Qt, начинал, бросал, потом снова начинал. И сейчас вот смог написать свою первую программу. До этого имел опыт программирования микроконтроллеров, писал прошивки на. . .
Транскрипция 55-минутного видео через Whisper: WhisperDesktop облажался, спас Google Colab[
anaschu 01.06.2026
Понадобилось получить текст из свежезагруженного видео на YouTube. Казалось бы, задача на пять минут. Заняла полтора часа. Делюсь опытом — может кому пригодится последовательность решений. . . .
21 мат мед. Планы на развитие модели здравоСохранения
anaschu 01.06.2026
AnyLogic: план развития симуляционной модели рабочего коллектива — динамический абсентеизм, реальные данные, три сценария сравнения Продолжаю серию постов о дискретно-событийной модели рабочего. . .
20. Мат мед. Абсентеизм как отдельный тип простоя
anaschu 29.05.2026
Апдейт модели: исправленные баги, абсентеизм и новые механизмы Продолжаю развивать ранее описанную модель рабочего коллектива на AnyLogic. За последние несколько дней был проведён серьёзный. . .
19. здоровье, усталость и психотип работника влияют на производительность предприятия, и наоборот, производительность на здоровье, усталось и психотип
anaschu 28.05.2026
Дискретно-событийная модель рабочего коллектива на AnyLogic: здоровье, выгорание, психотипы и микростимуляция Привет, коллеги. Хочу поделиться итогами нескольких недель работы над симуляционной. . .
"Прокси" для последовательного порта
Eddy_Em 28.05.2026
Эту штуку написал я достаточно давно. Но сейчас вот понадобилось настроить датчик грозы, но при этом не отключать его от "метеодемона". Соответственно, надо запустить этот "прокси": метеодемон будет. . .
Рефакторинг программы уравнивания.
Massaraksh7 26.05.2026
Пример по предыдущей записи в блоге. Но, надо заметить, что, во-первых, там оптимизация не только математики, но и работы с базой данных, и с графами, а во-вторых, это ещё не всё.
Использование TThread в Lazarus для математических вычислений.
Massaraksh7 25.05.2026
Производя рефакторинг своих программ на предмет ускорения их работы, обратил внимание на такой аспект, как сокращение времени матвычислений. Дело в том, что приходится работать с большими матрицами. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru