Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/7: Рейтинг темы: голосов - 7, средняя оценка - 5.00
1 / 1 / 0
Регистрация: 01.09.2019
Сообщений: 121

simd и умножение матриц

09.12.2021, 19:22. Показов 1537. Ответов 5
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте! помогите , пожалуйста, в объяснении действий, которые совершаются в программе. конкретные вопросы
1) ообъясните, пожалуйста, как можно проще, что такое simd инструкции и зачем они нужны
2) что конкрутно делает 8-11 строчка кода?
3) что делает 18-20 строчка кода?
4) 22-35 строчка
5) __m256 c_line = _mm256_setzero_ps(); __m256 tmp_line = _mm256_mul_ps(a_line, b_line); c_line = _mm256_add_ps(tmp_line, c_line); ч_mm_store_ps(&c[i][j], t4); то это за переменная?
для чего предназначена программа? 1. Сгенерировать 2 матрицы (A и B), размерностью 4096х4096, состоящие из произвольных чисел AVX, с плавающей точкой одинарной точности типа.
2. Вычислить произведение матриц с использованием SIMD-инструкций и с использованием скалярных вычислений.
где понять что сгенерирована матрица чисел такого типа?
ну и сама программа
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
#include <iostream>
#include <immintrin.h>
#include <chrono>
using namespace std;
 
const int M = 1024, N = 1024;
 
float scalar_mul(float** a, float** b, float** c);
float vector_mul(float** a, float** b, float** c);
float print_m(float** matrix);
float set_zero(float** matrix);
 
 
int main()
{
    setlocale(LC_ALL, "Russian");   
 
    float** a = new float* [M];
    float** b = new float* [M];
    float** c = new float* [M];
 
    for (int i = 0; i < M; i++) {
        a[i] = new float[N];
        b[i] = new float[N];
        c[i] = new float[N];
    }
 
    for (int i = 0; i < M; i++) {
        for (int j = 0; j < N; j++) {
            a[i][j] = j;
            b[i][j] = j;
            c[i][j] = 0;
        }
    }
 
    printf("---Скалярное умножение матриц %dx%d---\n", M, N);
    auto start1 = chrono::high_resolution_clock::now();
    scalar_mul(a, b, c);
    auto end1 = chrono::high_resolution_clock::now();
    //print_m(c);
    chrono::duration<float> duration1 = end1 - start1;
    printf("Время выполнения: %f секунд\n\n", duration1.count());
 
    set_zero(c);
 
    printf("---Векторное умножение матриц %dx%d---\n", M, N);
    auto start2 = chrono::high_resolution_clock::now();
    vector_mul(a, b, c);
    auto end2 = chrono::high_resolution_clock::now();
    //print_m(c);
    chrono::duration<float> duration2 = end2 - start2;
    printf("Время выполнения: %f секунд\n\n", duration2.count());
 
    printf("Done!\n\n");
}
 
 
float scalar_mul(float** a, float** b, float** c) {
    /*  СКАЛЯРНОЕ УМНОЖЕНИЕ   */
    for (int i = 0; i < M; i++) {
        for (int j = 0; j < N; j++) {
            for (int k = 0; k < M; k++) {
                c[i][j] = c[i][j] + a[i][k] * b[k][j];
            }
        }
    }
    return **c;
}
 
 
float vector_mul(float** a, float** b, float** c) {
    /*  ВЕКТОРНОЕ УМНОЖЕНИЕ   */
    //  транспонирование матрицы B
    float** bt = new float* [M];
 
    for (int i = 0; i < M; i++) {
        bt[i] = new float[N];
    }
 
    for (int i = 0; i < M; i++) {
        for (int j = 0; j < N; j++) {
            bt[i][j] = b[j][i];
        }
    }
    //  умножение матриц
    __m256 c_line = _mm256_setzero_ps();
    int step = sizeof(c_line) / sizeof(a[0][0]);
 
    for (int i = 0; i < M; i++) {
        for (int j = 0; j < N; j++) {
            __m256 c_line = _mm256_setzero_ps();
            for (int k = 0; k < N; k += step) {
 
                __m256 a_line = _mm256_load_ps(&a[i][k]);
 
                __m256 b_line = _mm256_load_ps(&bt[j][k]);
                __m256 tmp_line = _mm256_mul_ps(a_line, b_line);
                c_line = _mm256_add_ps(tmp_line, c_line);
            }
 
            __m256 t1 = _mm256_hadd_ps(c_line, c_line);
            __m256 t2 = _mm256_hadd_ps(t1, t1);
            __m128 t3 = _mm256_extractf128_ps(t2, 1);
            __m128 t4 = _mm_add_ss(_mm256_castps256_ps128(t2), t3);
 
            _mm_store_ps(&c[i][j], t4);
        }
    }
    return **c;
}
 
 
float print_m(float** matrix) {
    /*  ВЫВОД МАТРИЦЫ НА ЭКРАН   */
    for (int i = 0; i < M; i++) {
        for (int j = 0; j < N; j++) {
           cout << matrix[i][j] << " ";
        }
        cout << endl;
    }
    cout << endl;
    return 0;
}
 
 
float set_zero(float** matrix) {
    for (int i = 0; i < M; i++) {
        for (int j = 0; j < N; j++) {
            matrix[i][j] = 0;
        }
    }
    return **matrix;
}
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
09.12.2021, 19:22
Ответы с готовыми решениями:

Умножение треугольных матриц«Методы обработки разреженных матриц»
Нужно перемножить треугольные матрицы в обычном виде и в свёрнутом. С обычным проблем нет. Доступ к элементам свёрнутой матрицы...

Умножение матриц
Есть 2 функции перемножения квадратных матриц N*N вторая функция транспонирует вторую матрицу для того, чтобы перемножение шло строка на...

Умножение матриц
Доброго времени суток:) Помогите пожалуйста в написании программы. Пользователь вводит Матрицу А(размер 2х2) и Матрицу В(размер 2х2). ...

5
09.12.2021, 19:50

Не по теме:

Книжку пробовал читать?

0
2619 / 1630 / 266
Регистрация: 19.02.2010
Сообщений: 4,324
09.12.2021, 20:19
Цитата Сообщение от Попа с ручкой Посмотреть сообщение
размерностью 4096х4096
и
Цитата Сообщение от Попа с ручкой Посмотреть сообщение
const int M = 1024, N = 1024;
- не стыкуются. Тебя где-то жестоко накололи
0
1 / 1 / 0
Регистрация: 01.09.2019
Сообщений: 121
09.12.2021, 20:53  [ТС]
Пробовала
0
7804 / 6568 / 2988
Регистрация: 14.04.2014
Сообщений: 28,705
09.12.2021, 21:20
Цитата Сообщение от Попа с ручкой Посмотреть сообщение
объясните, пожалуйста, как можно проще, что такое simd инструкции
Просто групповое выполнение вычислений.
0
Эксперт CЭксперт С++
 Аватар для liv
5120 / 4573 / 855
Регистрация: 07.10.2015
Сообщений: 9,462
09.12.2021, 21:23
Или одновременная работа с несколькими данными
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
09.12.2021, 21:23
Помогаю со студенческими работами здесь

Умножение матриц
#include &lt;iostream&gt; using namespace std; int main(int argc, const char * argv) { int **C; int n,k; /*...

умножение матриц
Даны две целочисленные матрицы размером n x m и m x n. Если в матрице отсутствуют нулевые элементы, то определить произведение этих матриц....

Умножение 3 матриц
вод код моей процедуру { GetMatrixA(A); GetMatrixB(B); GetMatrixD(D); for( p= 1; p&lt;=count; p++) for( j= 1; j&lt;=n; j++) { ...

Умножение матриц
Помогите умножить 2 матрицы размерностью 4х4, нужно создать ф-ю. Я пробовал, не получилось.. typedef int mat44; void...

Умножение матриц
помогите сделать задачу: Даны матрицы: А размером m*k и В размером k*n.Получить матрицуС=A*В. Создавайте темы с осмысленными и понятными...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
Фото: Daniel Greenwood
kumehtar 13.11.2025
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru