Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.57/7: Рейтинг темы: голосов - 7, средняя оценка - 4.57
44 / 45 / 15
Регистрация: 11.08.2010
Сообщений: 226

Оптимизация кода с использование SIMD

28.02.2014, 19:59. Показов 1431. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Есть код

C++
1
2
3
4
inline double dot(const float* v1, const float* v2)
{
    return v1[0] * v2[0] + v1[1] * v2[1] + v1[2] * v2[2];
}
Переписал его вот так

C++
1
2
3
4
5
6
7
8
#define GET(res, i) _res.m128_f32[i]
inline double dot(const float* v1, const float* v2)
{
__m128 _one = {v1[0], v1[1], v1[2], 0.0f };
__m128 _two = {v2[0], v2[1], v2[2], 0.0f };
__m128 _res = _mm_mul_ps(_one, _two);
return GET(_res, 0) + GET(_res, 1) + GET(_res, 2);
}
По скорости получилось примерно одно и то же, по результатам этот вариант даже на пару % медленнее. Возможно ли его как-то оптимизировать еще?
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
28.02.2014, 19:59
Ответы с готовыми решениями:

Оптимизация методом Ньютона (нахождение точки минимума). Оптимизация кода
MATLAB только начал осваивать. Попытался реализовать нахождение точки минимума методом Ньютона для функции 2*X12 - X1*X2 + 3*X22 -...

Оптимизация кода. Замер времени выполнения части кода.
Доброе утро. Есть желание посмотреть сколько времени занимает выполнение какого-то блока кода/отдельной функции или процедуры/программы...

Типы оптимизация: черная оптимизация, серая оптимизация и белая оптимизация
Много много лет назад, на заре становления профессии "оптимизатора" в какой то умной книжке был создан миф. Это миф о цветовой индефикации...

1
4187 / 1835 / 220
Регистрация: 06.10.2010
Сообщений: 4,123
28.07.2014, 15:50
На SSE 4.1 это вычисляется одной инструкцией dpps, вектора нужно выравнивать по границе 16 байт.

Добавлено через 1 час 44 минуты
Что-то вроде
C
1
2
3
4
5
6
7
8
9
10
11
#include <stdio.h>
#include <smmintrin.h>
 
void main(){
    #define dot(x,y)_mm_dp_ps(x,y,0x71).m128_f32[0]
 
    __m128 a={1.0f, 2.0f, 3.0f, 4.0f};
    __m128 b={2.0f, 2.0f, 3.0f, 4.0f};
 
    printf("%f",dot(a,b));
}
На выходе у MSVC вполне кошерный код
Assembler
1
2
3
movaps xmm0,[a]
movaps xmm1,[b]
dpps   xmm1,xmm0,71h
Хотя руками можно и проще записать
Assembler
1
2
movaps xmm0,[a]
dpps   xmm0,[b],71h
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
28.07.2014, 15:50
Помогаю со студенческими работами здесь

Оптимизация кода
Все привет. У кого есть свободное время помогите советом, в каком направление оптимизоровать этот код ? здесь в основмном работа с бд...

Оптимизация кода, Си
День добрый. Ситация следующая. Код работает, все отлично, но написан он, мягко скажем, коряво. Если вкратце - есть 12 кнопок. Висят на...

Оптимизация кода
Доброе время господа программеры! В следствии своих скудных познаний в VBA (да и в программировании в целом) нагородил много страшного...

Оптимизация кода
Как можно оптимизировать данный программный код? Ответ объяснить void func() { for (int i = 0; i &lt; len; i++) { ...

Оптимизация кода
Добрый вечер, требуется проверка нескольких полей на пустоту, можно ли как то всю эту проверку сократить. if...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
Фото: Daniel Greenwood
kumehtar 13.11.2025
Расскажи мне о Мире, бродяга
kumehtar 12.11.2025
— Расскажи мне о Мире, бродяга, Ты же видел моря и метели. Как сменялись короны и стяги, Как эпохи стрелою летели. - Этот мир — это крылья и горы, Снег и пламя, любовь и тревоги, И бескрайние. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru