Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/3: Рейтинг темы: голосов - 3, средняя оценка - 4.67
0 / 0 / 0
Регистрация: 11.09.2021
Сообщений: 19

SIMD инструкции процессора

05.11.2023, 12:03. Показов 635. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Изучаю SIMD инструкции. Возникла проблема, что консоль не выводит ничего, хотя должна. В чем проблема может быть проблема? Есть знающие? Заранее спасибо.

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
#include <iostream>
#include <immintrin.h> 
 
const int N = 4096; 
 
 
float rand_float() {
    return static_cast<float>(rand()) / RAND_MAX;
}
 
 
void matrix_multiply_simd(float** A, float** B, float** C) {
    for (int i = 0; i < N; i++) {
        for (int j = 0; j < N; j++) {
            __m128 result = _mm_setzero_ps();  
            for (int k = 0; k < N; k += 4) {
                __m128 a = _mm_load_ps(&A[i][k]);
                __m128 b = _mm_load_ps(&B[k][j]);
                result = _mm_add_ps(result, _mm_mul_ps(a, b));  
            }
            _mm_store_ps(&C[i][j], result);  
        }
    }
}
 
 
void matrix_multiply_scalar(float** A, float** B, float** C) {
    for (int i = 0; i < N; i++) {
        for (int j = 0; j < N; j++) {
            C[i][j] = 0.0;
            for (int k = 0; k < N; k++) {
                C[i][j] += A[i][k] * B[k][j]; 
            }
        }
    }
}
 
int main() {
    float** A = new float* [N];
    float** B = new float* [N];
    float** C_simd = new float* [N];
    float** C_scalar = new float* [N];
 
    for (int i = 0; i < N; i++) {
        A[i] = new float[N];
        B[i] = new float[N];
        C_simd[i] = new float[N];
        C_scalar[i] = new float[N];
    }
 
    
    for (int i = 0; i < N; i++) {
        for (int j = 0; j < N; j++) {
            A[i][j] = rand_float();
            B[i][j] = rand_float();
        }
    }
 
   
    matrix_multiply_simd(A, B, C_simd);
 
   
    matrix_multiply_scalar(A, B, C_scalar);
 
   
    bool result_match = true;
    for (int i = 0; i < N; i++) {
        for (int j = 0; j < N; j++) {
            if (C_simd[i][j] != C_scalar[i][j]) {
                result_match = false;
                break;
            }
        }
        if (!result_match) {
            break;
        }
    }
 
    if (result_match) {
        std::cout << "Векторное умножение работает правильно." << std::endl;
    }
    else {
        std::cout << "Векторное умножение работает неправильно." << std::endl;
    }
 
    for (int i = 0; i < N; i++) {
        delete[] A[i];
        delete[] B[i];
        delete[] C_simd[i];
        delete[] C_scalar[i];
    }
    delete[] A;
    delete[] B;
    delete[] C_simd;
    delete[] C_scalar;
 
    std::cin.get();
 
    return 0;
}
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
05.11.2023, 12:03
Ответы с готовыми решениями:

Что такое блоки и инструкции, вложенные инструкции и главные инструкции?
Что это такое?

Существует ли тип процессора и его конвейера для выполнения после себя определённой инструкции?
Есть в памяти команды, точнее как бы просто в памяти блоками разбросаны наборы инструкций. Вот грубо говоря, после выполнения одного...

Как возможно выйти в инструкции switch в начало самой инструкции при нажатии "не правильной" кнопки
В целом у меня вопрос такой: Как возможно выйти в инструкции switch в начало самой инструкции при нажатии не правильной кнопки. Вот...

3
2615 / 1627 / 265
Регистрация: 19.02.2010
Сообщений: 4,318
05.11.2023, 13:15
Лучший ответ Сообщение было отмечено agfnv как решение

Решение

Цитата Сообщение от agfnv Посмотреть сообщение
консоль не выводит ничего, хотя должна.
А сколько времени ждал?
В задаче при данном размере матриц - идёт аццки тормозной упор в память, поскольку
1) объём данных в каждой из матриц многократно превышает размеры кэша, и
2) нелокальный доступ к элементам матрицы B.
Поэтому прога могла просто не доходить до печати ответа, застряв на долгом счёте.

Рекомендую покурить хорошую старую буржуинскую учебную лекцию http://stellar.mit.edu/S/cours... nd_MxM.pdf. До стр21 не нужно, стр21-53 надо проглядеть по диагонали - и вдумываться в 54-63, дальше тоже не особо нужно.
А вкурив - до векторизации сделай транспонирование второй матрицы и блочный алгоритм перемножения под размер L2-кэша процессора (именно L2 - т.к. L3-кэш хоть и сильно больше размерами, но и сильно тормознее), что само по себе ускорит сишный код в значимые разЫ. Транспонирование можно потом оставить сишным кодом, т.е. векторизовать только сам блочный алгоритм.
1
2615 / 1627 / 265
Регистрация: 19.02.2010
Сообщений: 4,318
06.11.2023, 11:46
agfnv, вот ещё вспомнился другой старый буржуинский классический материал https://people.freebsd.org/~ls... memory.pdf - там раздел 6.2.1 и приложение A.1 как раз про перемножение матриц, пример с движением от наивного сишного кода через транспонирование и блокинг к векторизации с помощью интринсиков.
0
Вездепух
Эксперт CЭксперт С++
 Аватар для TheCalligrapher
12919 / 6787 / 1817
Регистрация: 18.10.2014
Сообщений: 17,169
06.11.2023, 11:55
Цитата Сообщение от agfnv Посмотреть сообщение
Возникла проблема, что консоль не выводит ничего, хотя должна.
HEAP CORRUPTION DETECTED: after normal block (#360) at 0x01085358
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
06.11.2023, 11:55
Помогаю со студенческими работами здесь

Нужно засунуть код инструкции в 4 char'a так, чтобы в памяти это был код инструкции.
Доброго времени суток. Есть дизассемблированный код. Нужно засунуть код иструкции в 4 чара так, чтобы в памяти это был код инструкции. Как...

OpenMP и SIMD
Добрый день. Не могу исправить код, чтобы использовалось 4 ядра, а не 1. В функцию proizv нужно добавить распараллеливание вычислений с...

simd и умножение матриц
Здравствуйте! помогите , пожалуйста, в объяснении действий, которые совершаются в программе. конкретные вопросы 1) ообъясните,...

SIMD (Классификация по Флинну)
Здравствуйте ,у меня есть один вопрос ,я сейчас изучаю то как устроен процессор ,и я наткнулся на SIMD ,далее я нашел табличку под...

Поддерживает ли Java SIMD
Подскажите пожалуйста, есть ли в Java каким-то образом реализованная поддержка SIMD? Вообще есть ли возможность работать с SIMD в Java?


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
Фото: Daniel Greenwood
kumehtar 13.11.2025
Расскажи мне о Мире, бродяга
kumehtar 12.11.2025
— Расскажи мне о Мире, бродяга, Ты же видел моря и метели. Как сменялись короны и стяги, Как эпохи стрелою летели. - Этот мир — это крылья и горы, Снег и пламя, любовь и тревоги, И бескрайние. . .
PowerShell Snippets
iNNOKENTIY21 11.11.2025
Модуль PowerShell 5. 1+ : Snippets. psm1 У меня модуль расположен в пользовательской папке модулей, по умолчанию: \Documents\WindowsPowerShell\Modules\Snippets\ А в самом низу файла-профиля. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru