|
|
|
Производительность OpenCL14.08.2014, 15:35. Показов 60565. Ответов 474
Метки нет (Все метки)
Доброго времени!
Написал тест для будущих расчётов с использованием OpenCL и проверил на разных системах: ( дрова для AMD 14.4; для nVidia 340.52 ) Radeon HD 7970(2048/925MHz; 384bit; 3Gb/5GHz) и CPU AMD 8120 справились за 4.3 секунды GeForce GTX 760(1152/980MHz; 256bit; 4Gb/6GHz) и CPU Intel Q9450 справились за 22.5 секунд GeForce GTS 450(192/750MHz; 128bit; 2Gb/??) и CPU Intel i7 2600 справились за 46.0 секунд GeForce GT 520M(48/740MHz; 64bit; 2Gb/??) и CPU Intel 2630QM справились за 117.0 секунд Интересен слив GTX 760 который оказался в 5,2 раза медленней(хотя по цене так не скажешь). Похоже дело в двойной точности(DP) которая у GeForce урезана маркетологами до 1/24 от производительности одинарной точности(SP). Хотя на титанах говорят оставили полную поддержку 1/3 как в Tesla'x(нужно включать спец галочку в дровах). У всех радиков вроде 1/2. Ну и плюс к этому, наверное, сам OpenCL драйвер не лучшим образом реализован ибо есть своя CUDA, которая при всех остальных равных не нужна будет ни кому. Поэтому интересуют тесты либо на более слабых радеонах, либо на топовых джифорсах. А лучше и те и те и побольше! Ищутся счастливые обладатели карт и готовые скачать и запустить тест( ~30 Мбайт ): GeForce GTX 780(с TI или без) GeForce GTX TITAN(с BLACK EDITION или без) Radeon R9 290( с Х или без ) - для этих карт наверно уже результат будет больше зависеть от CPU Ну и любые другие радики не старше HD 7000. https://cloud.mail.ru/public/f... L_TEST.rar Распаковать архив полностью и запусить ехе Обязательно укажите проц.
0
|
|
| 14.08.2014, 15:35 | |
|
Ответы с готовыми решениями:
474
OpenCL на С++ OpenCL на OS X Программа в OpenCL |
|
дивананалитикаиксперд
15216 / 10907 / 914
Регистрация: 08.01.2013
Сообщений: 39,106
|
|||
| 11.03.2016, 10:29 | |||
В общем, все по честному, без обмана.i7 4770K @4.1 и 4.5ггц но, слегка меняется.
0
|
|||
|
3205 / 1915 / 324
Регистрация: 25.10.2011
Сообщений: 5,566
|
||
| 11.03.2016, 10:34 | ||
|
А по процу логично, невозможно отлучить винду и прочее от него.
0
|
||
|
|
||
| 11.03.2016, 14:21 [ТС] | ||
|
Думаю изменить доступ к памяти, чтобы хотя бы большинство используемых эл-тов данных в вычислителях/ядрах/кернелов физически находились в одном месте, таким образом эффективность кэша теоретически должна вырасти. А как на самом деле будет - посмотрим.
0
|
||
|
дивананалитикаиксперд
15216 / 10907 / 914
Регистрация: 08.01.2013
Сообщений: 39,106
|
|
| 21.07.2016, 09:34 | |
|
1
|
|
|
827 / 244 / 47
Регистрация: 24.01.2013
Сообщений: 750
|
|
| 31.03.2018, 10:57 | |
|
0
|
|
|
Заблокирован
|
|
| 31.03.2018, 11:38 | |
|
1
|
|
|
827 / 244 / 47
Регистрация: 24.01.2013
Сообщений: 750
|
|
| 31.03.2018, 12:01 | |
|
dimank666, а Райзен 7 ?
по идее должен вписаться... если там конечно с векторными инструкциями все в порядке.
0
|
|
|
дивананалитикаиксперд
15216 / 10907 / 914
Регистрация: 08.01.2013
Сообщений: 39,106
|
|
| 31.03.2018, 13:00 | |
|
1
|
|
|
827 / 244 / 47
Регистрация: 24.01.2013
Сообщений: 750
|
|
| 31.03.2018, 13:02 | |
|
K2K, ясно, спасибо.
0
|
|
|
Заблокирован
|
|
| 31.03.2018, 14:51 | |
|
0
|
|
|
827 / 244 / 47
Регистрация: 24.01.2013
Сообщений: 750
|
||
| 31.03.2018, 17:56 | ||
|
Обычно он с драйвером на видяху устанавливается, но если видяха и проц от разных вендоров, то нужен отдельно драйвер на проц. У меня, например, видяха от АМД, то пришлось скачивать "OpenCL™ Drivers and Runtimes for Intel®" для CPU. Этот драйвер компилит код с использованием SSE и AVX инструкций.
0
|
||
|
|
||
| 31.03.2018, 18:12 [ТС] | ||
|
Поставь свежак от интела (40Мб) https://software.intel.com/en-... PU_runtime Не уверен что это поможет НО, я помню, ты на Фуфыкс ставил
0
|
||
|
Заблокирован
|
||
| 31.03.2018, 19:58 | ||
|
делал чрез тимвивер так что в живую будет лучше
0
|
||
|
Заблокирован
|
|
| 31.03.2018, 20:11 | |
|
провел на чистую
1
|
|
|
Заблокирован
|
||
| 31.03.2018, 20:54 | ||
|
Если так судить то мой 8700К проходит этот тест на частоте 4300 я не обновлял на новый биус, где пофиксили тпд баг ![]() если так судить 6700К@4500 набирает 16,7 8700К@4300 набирает 11,9 то 8700К на частоте 4500 должен меньше 9,0 набирать ждем WyPik, с его 4,9 в турбо режиме
0
|
||
|
827 / 244 / 47
Регистрация: 24.01.2013
Сообщений: 750
|
|
| 31.03.2018, 21:03 | |
|
Да это же интеловский драйвер OpenCL, может он код оптимизирует под ихнюю архитектуру.
Надо бы амд'ешный родной драйвер поискать... для чистоты эксперимента.
0
|
|
|
Форумчанин
5959 / 4193 / 406
Регистрация: 28.12.2013
Сообщений: 24,134
|
|
| 01.04.2018, 18:24 | |
|
dimank666, у меня эта приблуда не видит проц,только карту.Да и шо тебе мешает разогнать свой?
0
|
|
|
Заблокирован
|
|
| 01.04.2018, 18:27 | |
|
0
|
|
|
Форумчанин
5959 / 4193 / 406
Регистрация: 28.12.2013
Сообщений: 24,134
|
|
| 01.04.2018, 18:28 | |
|
dimank666, на проц?
0
|
|
| 01.04.2018, 18:28 | |
|
Работа с OpenCL Где скачать OpenCL C++? OpenCL в Builder и не только Глобальная переменная в OpenCL OpenCL - ошибка 0xc0000005 Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Программа для com-порта
Uhbif79 05.06.2026
Всем привет, давно хотел изучить Qt, начинал, бросал, потом снова начинал. И сейчас вот смог написать свою первую программу.
До этого имел опыт программирования микроконтроллеров, писал прошивки на. . .
|
Транскрипция 55-минутного видео через Whisper: WhisperDesktop облажался, спас Google Colab[
anaschu 01.06.2026
Понадобилось получить текст из свежезагруженного видео на YouTube. Казалось бы, задача на пять минут. Заняла полтора часа. Делюсь опытом — может кому пригодится последовательность решений.
. . .
|
21 мат мед. Планы на развитие модели здравоСохранения
anaschu 01.06.2026
AnyLogic: план развития симуляционной модели рабочего коллектива — динамический абсентеизм, реальные данные, три сценария сравнения
Продолжаю серию постов о дискретно-событийной модели рабочего. . .
|
20. Мат мед. Абсентеизм как отдельный тип простоя
anaschu 29.05.2026
Апдейт модели: исправленные баги, абсентеизм и новые механизмы
Продолжаю развивать ранее описанную модель рабочего коллектива на AnyLogic. За последние несколько дней был проведён серьёзный. . .
|
|
19. здоровье, усталость и психотип работника влияют на производительность предприятия, и наоборот, производительность на здоровье, усталось и психотип
anaschu 28.05.2026
Дискретно-событийная модель рабочего коллектива на AnyLogic: здоровье, выгорание, психотипы и микростимуляция
Привет, коллеги. Хочу поделиться итогами нескольких недель работы над симуляционной. . .
|
"Прокси" для последовательного порта
Eddy_Em 28.05.2026
Эту штуку написал я достаточно давно. Но сейчас вот понадобилось настроить датчик грозы, но при этом не отключать его от "метеодемона". Соответственно, надо запустить этот "прокси": метеодемон будет. . .
|
Рефакторинг программы уравнивания.
Massaraksh7 26.05.2026
Пример по предыдущей записи в блоге. Но, надо заметить, что, во-первых, там оптимизация не только математики, но и работы с базой данных, и с графами, а во-вторых, это ещё не всё.
|
Использование TThread в Lazarus для математических вычислений.
Massaraksh7 25.05.2026
Производя рефакторинг своих программ на предмет ускорения их работы, обратил внимание на такой аспект, как сокращение времени матвычислений. Дело в том, что приходится работать с большими матрицами. . .
|