![]() |
|
Производительность OpenCL14.08.2014, 15:35. Показов 50441. Ответов 465
Метки нет Все метки)
(
Доброго времени!
Написал тест для будущих расчётов с использованием OpenCL и проверил на разных системах: ( дрова для AMD 14.4; для nVidia 340.52 ) Radeon HD 7970(2048/925MHz; 384bit; 3Gb/5GHz) и CPU AMD 8120 справились за 4.3 секунды GeForce GTX 760(1152/980MHz; 256bit; 4Gb/6GHz) и CPU Intel Q9450 справились за 22.5 секунд GeForce GTS 450(192/750MHz; 128bit; 2Gb/??) и CPU Intel i7 2600 справились за 46.0 секунд GeForce GT 520M(48/740MHz; 64bit; 2Gb/??) и CPU Intel 2630QM справились за 117.0 секунд Интересен слив GTX 760 который оказался в 5,2 раза медленней(хотя по цене так не скажешь). Похоже дело в двойной точности(DP) которая у GeForce урезана маркетологами до 1/24 от производительности одинарной точности(SP). Хотя на титанах говорят оставили полную поддержку 1/3 как в Tesla'x(нужно включать спец галочку в дровах). У всех радиков вроде 1/2. Ну и плюс к этому, наверное, сам OpenCL драйвер не лучшим образом реализован ибо есть своя CUDA, которая при всех остальных равных не нужна будет ни кому. Поэтому интересуют тесты либо на более слабых радеонах, либо на топовых джифорсах. А лучше и те и те и побольше! Ищутся счастливые обладатели карт и готовые скачать и запустить тест( ~30 Мбайт ): GeForce GTX 780(с TI или без) GeForce GTX TITAN(с BLACK EDITION или без) Radeon R9 290( с Х или без ) - для этих карт наверно уже результат будет больше зависеть от CPU Ну и любые другие радики не старше HD 7000. https://cloud.mail.ru/public/f... L_TEST.rar Распаковать архив полностью и запусить ехе Обязательно укажите проц.
0
|
14.08.2014, 15:35 | |
Ответы с готовыми решениями:
465
OpenCL на С++ OpenCL на OS X Программа в OpenCL |
![]() |
|
14.08.2014, 19:54 [ТС] | |
ussrex, Сильный проц! Так как 760 это вроде тот же 670 то дополнительные 2-3 секунды выигрыша очевидно принёс именно проц.
Добавлено через 2 минуты Страшно представить i7 + Radeon
0
|
![]() |
|
14.08.2014, 22:52 [ТС] | |
Тест читает процент воды на трассе между 2-мя точками. Таких трасс в данном тесте более 4.5 млн штук
Добавлено через 11 минут Если считать классическим методом такое же кол-во профилей/трасс, то одно ядро проца считалось бы минут 25
0
|
![]() |
|||
15.08.2014, 14:33 [ТС] | |||
Кстати, Полицейскую академию смотрел все части и не одни раз, но такого выражения не помню. Говорят, что в новой архитектуре Maxwel от nVidia по мимо увеличения энергоэффективности сделали упор и в сторону "не-графческих" вычислений. За счёт чего я так и не понял. Или это только слухи... Примечательно то что карты с таким чипом уже есть в продаже GeForce GTX 750 TI( 640/1GHz; 128bit; 2Gb/5.4GHz ) По количественным характеристикам не впечатляет. Но затестил бы её с удовольстием.
0
|
![]() 178 / 153 / 8
Регистрация: 26.12.2012
Сообщений: 676
|
|
15.08.2014, 14:54 | |
Да ладно, я просто улыбнулся. А выражение это из первой серии, когда коменданту предложили избавиться от неудобных кадетов и спросили, понял ли он, что от него требуется. (Ну тут возможны вариации перевода).
Добавлено через 2 минуты Если еще чем помочь могу в плане потестить, милости просим, можно прямо в личку.
1
|
![]() ![]() |
|
15.08.2014, 16:31 | |
HD7850 + i5-3470
процессор так и не смог пройти тест - при старте быстро вылазят несколько консольных окон и закрываются. Программа входит в ступор и висит, загружая процессор на 100% (ждал около 5 минут)
1
|
![]() |
||
15.08.2014, 18:02 [ТС] | ||
Я использую такие(Win7 x64): https://cloud.mail.ru/public/7... _setup.msi Добавлено через 8 минут 30 секунд для HD 7850? хм я ожидал большего. Какие дрова 14,4? Видимо кроме кол-ва шейдеров сильно влияют ещё какие-то блоки. Например TMU
0
|
![]() |
|||||||
15.08.2014, 18:09 [ТС] | |||||||
Если кому интересно, код ядра:
Как видно много DP(double precision) кода + 1 read_imagei, который нагружает TMU.
0
|
![]() |
|
16.08.2014, 11:40 [ТС] | |
0
|
16.08.2014, 12:10 | ||
Не по теме:
Ну, или ссылка в txt на его профиль - remmer29.txt Но, нужна рега на сайте и несколько сообщений, чтоб написать. Ты уж извини, но я ему писать не буду, что-то мы иногда недопонимаем друг-друга :D
0
|
дивананалитикаиксперд
![]() 14723 / 10543 / 904
Регистрация: 08.01.2013
Сообщений: 37,485
|
|
16.08.2014, 14:58 | |
Если кому интересно, то беседа с товарищем складывается не очень благоприятно. Почитать можно отсюда, ссылка в txt - 111.txt Ну и если он таки сподобится, то думаю, что выложит результат там же. Такие вот они нежные, владельцы черных титанов
![]()
1
|
Заблокирован
|
|
16.08.2014, 18:18 | |
8320@4000 + 270X
так я тут, и мой 8 литровый движок тоже ![]() значит так после того как поставил обновленный драйвер то появилась еще одна строка с выбором в вашей программе отличие только в памяти у одного процессора 2048 у другого 2047(и этот быстрее как видно)
1
|
дивананалитикаиксперд
![]() 14723 / 10543 / 904
Регистрация: 08.01.2013
Сообщений: 37,485
|
||
16.08.2014, 18:28 | ||
![]() ![]()
0
|
16.08.2014, 18:28 | |
Помогаю со студенческими работами здесь
20
Работа с OpenCL Где скачать OpenCL C++? OpenCL в Builder и не только Глобальная переменная в OpenCL OpenCL - ошибка 0xc0000005 Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Опции темы | |
|
Новые блоги и статьи
![]() |
||||
Unity 4D
GameUnited 13.06.2025
Четырехмерное пространство. . . Звучит как что-то из научной фантастики, правда? Однако для меня, как разработчика со стажем в игровой индустрии, четвертое измерение давно перестало быть абстракцией из. . .
|
SSE (Server-Sent Events) в ASP.NET Core и .NET 10
UnmanagedCoder 13.06.2025
Кажется, Microsoft снова подкинула нам интересную фичу в новой версии фреймворка. Работая с превью . NET 10, я наткнулся на нативную поддержку Server-Sent Events (SSE) в ASP. NET Core Minimal APIs. Эта. . .
|
С днём независимости России!
Hrethgir 13.06.2025
Решил побеседовать, с утра праздничного дня, с LM о завоеваниях. То что она написала о народе, представителем которого я являюсь сам сначала возмутило меня, но дальше только смешило. Это чисто. . .
|
Лето вокруг.
kumehtar 13.06.2025
Лето вокруг.
Наполненное бурями и ураганами событий. На фоне магии Жизни, священной и вечной, неумелой рукой человека рисуется панорама душевного непокоя.
Странные серые краски проникают и. . .
|
Популярные LM модели ориентированы на увеличение затрат ресурсов пользователями сгенерированного кода (грязь -заслуги чистоплюев).
Hrethgir 12.06.2025
Вообще обратил внимание, что они генерируют код (впрочем так-же ориентированы разработчики чипов даже), чтобы пользователь их использующий уходил в тот или иной убыток. Это достаточно опытные модели,. . .
|
Топ10 библиотек C для квантовых вычислений
bytestream 12.06.2025
Квантовые вычисления - это та область, где теория встречается с практикой на границе наших знаний о физике. Пока большая часть шума вокруг квантовых компьютеров крутится вокруг языков высокого уровня. . .
|
Dispose и Finalize в C#
stackOverflow 12.06.2025
Работая с C# больше десяти лет, я снова и снова наблюдаю одну и ту же историю: разработчики наивно полагаются на сборщик мусора, как на волшебную палочку, которая решит все проблемы с памятью. Да,. . .
|
Повышаем производительность игры на Unity 6 с GPU Resident Drawer
GameUnited 11.06.2025
Недавно копался в новых фичах Unity 6 и наткнулся на GPU Resident Drawer - штуку, которая заставила меня присвистнуть от удивления. По сути, это внутренний механизм рендеринга, который автоматически. . .
|
Множества в Python
py-thonny 11.06.2025
В Python существует множество структур данных, но иногда я сталкиваюсь с задачами, где ни списки, ни словари не дают оптимального решения. Часто это происходит, когда мне нужно быстро проверять. . .
|
Работа с ccache/sccache в рамках C++
Loafer 11.06.2025
Утилиты ccache и sccache занимаются тем, что кешируют промежуточные результаты компиляции, таким образом ускоряя последующие компиляции проекта. Это означает, что если проект будет компилироваться. . .
|