С Новым годом! Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/3: Рейтинг темы: голосов - 3, средняя оценка - 4.67
2 / 2 / 0
Регистрация: 31.08.2015
Сообщений: 18

Оптимизация программы

12.12.2019, 16:55. Показов 668. Ответов 4

Студворк — интернет-сервис помощи студентам
Добрый день, попытался реализовать алгоритм Штрассена для умножения квадратных матриц
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
#include <iostream>
#include <cstdlib>
#include <ctime>
#include <new>
 
using namespace std;
 
int s, n2;
 
void inMatrix(int* a, const int* b, int n)
{
    for (int i = 0; i < n; ++i)
    {
        int p = i * n2;
 
        for (int j = 0; j < n; ++j)
            a[p + j] = b[p + j];
    }
}
 
void outMatrix(const int* a, int n)
{
    for (int i = 0; i < n; ++i)
    {
        int p = i * n2;
 
        for (int j = 0; j < n; ++j)
            cout << a[p + j] << ' ';
        cout << '\n';
    }
    cout << '\n';
}
 
int* addMatrix(const int* a, bool sign, const int* b, int n)// sign == 0(1) = > a +(-) b, m - размер подматрицы, n - исходной матрицы
{
    int* c = new int[s], i, j;
 
    if (sign)
    {
        for (i = 0; i < n; ++i)
        {
            int p = i * n2;
 
            for (j = 0; j < n; ++j)
                c[p + j] = a[p + j] - b[p + j];
        }
    }
    else
    {
        for (i = 0; i < n; ++i)
        {
            int p = i * n2;
 
            for (j = 0; j < n; ++j)
                c[p + j] = a[p + j] + b[p + j];
        }
    }
 
    return c;
}
 
void strassen(int* c, const int* a, const int* b, int n)
{
    if (n == 2)
    {
        int d11 = 0,
            d12 = 1,
            d21 = n2,
            d22 = n2 + 1;
 
        c[d11] = a[d11] * b[d11] + a[d12] * b[d21];
        c[d12] = a[d11] * b[d12] + a[d12] * b[d22];
        c[d21] = a[d21] * b[d11] + a[d22] * b[d21];
        c[d22] = a[d21] * b[d12] + a[d22] * b[d22];
    }
    else
    {
        int m = n >> 1,
            d11 = 0,
            d12 = m,
            d21 = m * n2,
            d22 = m * (n2 + 1),
            * m1 = new int[s],
            * m2 = new int[s],
            * m3 = new int[s],
            * m4 = new int[s],
            * m5 = new int[s],
            * m6 = new int[s],
            * m7 = new int[s];
 
        // M1 = (A11 + A22) * (B11 + B22)
        strassen(m1, addMatrix(a + d11, 0, a + d22, m), addMatrix(b + d11, 0, b + d22, m), m);
 
        // M2 = (A21 + A22) * B11
        strassen(m2, addMatrix(a + d21, 0, a + d22, m), b + d11, m);
 
        // M3 = A11 * (B12 - B22)
        strassen(m3, a + d11, addMatrix(b + d12, 1, b + d22, m), m);
 
        // M4 = A22 * (B21 - B11)
        strassen(m4, a + d22, addMatrix(b + d21, 1, b + d11, m), m);
 
        // M5 = (A11 + A12) * B22
        strassen(m5, addMatrix(a + d11, 0, a + d12, m), b + d22, m);
 
        // M6 = (A21 - A11) * (B11 + B12)
        strassen(m6, addMatrix(a + d21, 1, a + d11, m), addMatrix(b + d11, 0, b + d12, m), m);
 
        // M7 = (A12 - A22) * (B21 + B22)
        strassen(m7, addMatrix(a + d12, 1, a + d22, m), addMatrix(b + d21, 0, b + d22, m), m);
 
        // C11 = M1 + M4 - M5 + M7 
        inMatrix(c + d11, addMatrix(addMatrix(addMatrix(m1, 0, m4, m), 1, m5, m), 0, m7, m), m);
 
        // C12 = M3 + M5
        inMatrix(c + d12, addMatrix(m3, 0, m5, m), m);
 
        // C21 = M2 + M4
        inMatrix(c + d21, addMatrix(m2, 0, m4, m), m);
 
        // C22 = M1 + M3 - M2 + M6
        inMatrix(c + d22, addMatrix(addMatrix(addMatrix(m1, 0, m3, m), 1, m2, m), 0, m6, m), m);
 
        delete[] m1;
        delete[] m2;
        delete[] m3;
        delete[] m4;
        delete[] m5;
        delete[] m6;
        delete[] m7;
    }
}
 
int isPowerOf2(int n)
{
    return !(n & (n - 1));
}
 
int clp2(int n)
{
    n--;
    for (int p = 1; p < 32; p <<= 1)
        n |= (n >> p);
    return ++n;
}
 
int main()
{
    int n, * a, * b, * c, i, j;
    time_t strt, stp;
 
    srand(time(NULL));
 
    cin >> n;
 
    // n <= n2 = 2^k
    if (isPowerOf2(n))
        n2 = n;
    else n2 = clp2(n);
 
    s = n2 * n2;
    a = new int[s]();
    b = new int[s]();
    c = new int[s];
 
    for (i = 0; i < n; ++i)
    {
        int p = i * n2;
 
        for (j = 0; j < n; ++j)
        {
            a[p + j] = rand() % n;
            b[p + j] = rand() % n;
        }
    }
 
    //вывод без нулей
    outMatrix(a, n);
    outMatrix(b, n);
 
    strt = clock();
 
    strassen(c, a, b, n2);
 
    stp = clock();
 
    outMatrix(c, n);
 
    cout << (stp - strt) / CLOCKS_PER_SEC << " s (" << (stp - strt) << " ticks) for n = " << n << '\n';
 
    delete[] a;
    delete[] b;
    delete[] c;
}
Для малых n алгоритм работает корректно, но например для n=256 - ложит мой ПК, компилятор VS2019, алгоритм затрачивает много памяти, может быть оптизация памяти помогла бы, кто мог бы предложить что-нибудь конкретное?
Также не исключаю возможности переполнения массивов, все они обычные-интовые.
Спасибо!
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
12.12.2019, 16:55
Ответы с готовыми решениями:

Оптимизация программы
Нужно, чтобы программа случайным образом придумывала число от 1 до 32767 и печатала его цифры через 2 пробела. (Например, 4236 печатает 4 ...

Оптимизация программы
Помогите оптимизировать программу, не могу сам. #include &lt;iostream&gt; #include &lt;conio.h&gt; using namespace std; int main() ...

Оптимизация программы
Как ещё можно оптимизировать нижеприведенный код? По условию задачи он выполняется дооолго. Собственно вот задача: В секретной...

4
2623 / 1634 / 266
Регистрация: 19.02.2010
Сообщений: 4,345
12.12.2019, 17:28
Цитата Сообщение от kiberqqq Посмотреть сообщение
алгоритм затрачивает много памяти, может быть оптизация памяти помогла бы
Да, сейчас не удаляются все массивы, которые создаются в addMatrix() и возвращаются из неё.

Ну и я бы раскидал addMatrix() на 2 варианта - для sign=0 и sign=1, чтобы была меньшая нагрузка на стек проги, и чтобы просто не тратить время на условные проверки.
1
2 / 2 / 0
Регистрация: 31.08.2015
Сообщений: 18
12.12.2019, 19:11  [ТС]
а разве этот массив не удаляется как и любая локальная переменная при выходе из функции?
если это так, то каким образом можно его можно удалить?
спасибо за советы
0
2623 / 1634 / 266
Регистрация: 19.02.2010
Сообщений: 4,345
12.12.2019, 20:02
Нет, динамически выделенная через new память автоматом не удаляется - удаляется только лишь локальная переменная-указатель. Нужно явно пользоваться delete[] после того, как память перестала быть нужной.
0
2 / 2 / 0
Регистрация: 31.08.2015
Сообщений: 18
12.12.2019, 21:19  [ТС]
Провёл "оптимизацию", но программа всё-равно не отличается высоким быстродействием
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
#include <iostream>
#include <cstdlib>
#include <ctime>
#include <new>
 
//алгоритм Штрассена
 
//сложность O(n^log7) достигается за счёт уменьшения количества умножений, за счёт блочного умножения матриц уменьшается число промахов кеша
//при больших n происходят ошибки выделения памяти, это связано с тем, что программа использует больший объём памяти
 
using namespace std;
 
int s, n2;
 
void inMatrix(int* a, const int* b, int n)
{
    for (int i = 0; i < n; ++i)
    {
        int p = i * n2;
 
        for (int j = 0; j < n; ++j)
            a[p + j] = b[p + j];
    }
}
 
void outMatrix(const int* a, int n)
{
    for (int i = 0; i < n; ++i)
    {
        int p = i * n2;
 
        for (int j = 0; j < n; ++j)
            cout << a[p + j] << ' ';
        cout << '\n';
    }
    cout << '\n';
}
 
void subMatrix(int *c, const int* a, const int* b, int n)
{
    for (int i = 0; i < n; ++i)
    {
        int p = i * n2;
 
        for (int j = 0; j < n; ++j)
            c[p + j] = a[p + j] - b[p + j];
    }
}
 
void addMatrix(int *c, const int* a, const int* b, int n)
{
    for (int i = 0; i < n; ++i)
    {
        int p = i * n2;
 
        for (int j = 0; j < n; ++j)
            c[p + j] = a[p + j] + b[p + j];
    }
}
 
void strassen(int* c, const int* a, const int* b, int n)
{
    if (n == 2)
    {
        int d11 = 0,
            d12 = 1,
            d21 = n2,
            d22 = n2 + 1;
 
        c[d11] = a[d11] * b[d11] + a[d12] * b[d21];
        c[d12] = a[d11] * b[d12] + a[d12] * b[d22];
        c[d21] = a[d21] * b[d11] + a[d22] * b[d21];
        c[d22] = a[d21] * b[d12] + a[d22] * b[d22];
    }
    else
    {
        int m = n >> 1,
            d11 = 0,
            d12 = m,
            d21 = m * n2,
            d22 = m * (n2 + 1),
            * m1 = new int[s],
            * m2 = new int[s],
            * m3 = new int[s],
            * m4 = new int[s],
            * m5 = new int[s],
            * m6 = new int[s],
            * m7 = new int[s],
            * add1 = new int[s],
            * add2 = new int[s];
 
        // M1 = (A11 + A22) * (B11 + B22)
        addMatrix(add1, a + d11, a + d22, m);
        addMatrix(add2, b + d11, b + d22, m);
        strassen(m1, add1, add2, m);
 
        // M2 = (A21 + A22) * B11
        addMatrix(add1, a + d21, a + d22, m);
        strassen(m2, add1, b + d11, m);
 
        // M3 = A11 * (B12 - B22)
        subMatrix(add1, b + d12, b + d22, m);
        strassen(m3, a + d11, add1, m);
 
        // M4 = A22 * (B21 - B11)
        subMatrix(add1, b + d21, b + d11, m);
        strassen(m4, a + d22, add1, m);
 
        // M5 = (A11 + A12) * B22
        addMatrix(add1, a + d11, a + d12, m);
        strassen(m5, add1, b + d22, m);
 
        // M6 = (A21 - A11) * (B11 + B12)
        subMatrix(add1, a + d21, a + d11, m);
        addMatrix(add2, b + d11, b + d12, m);
        strassen(m6, add1, add2, m);
 
        // M7 = (A12 - A22) * (B21 + B22)
        subMatrix(add1, a + d12, a + d22, m);
        addMatrix(add2, b + d21, b + d22, m);
        strassen(m7, add1, add2, m);
 
        // C11 = M1 + M4 - M5 + M7
        addMatrix(add1, m1, m4, m);
        subMatrix(add2, add1, m5, m);
        addMatrix(add1, add2, m7, m);
        inMatrix(c + d11, add1, m);
 
        // C12 = M3 + M5
        addMatrix(add1, m3, m5, m);
        inMatrix(c + d12, add1, m);
 
        // C21 = M2 + M4
        addMatrix(add1, m2, m4, m);
        inMatrix(c + d21, add1, m);
 
        // C22 = M1 + M3 - M2 + M6
        addMatrix(add1, m1, m3, m);
        subMatrix(add2, add1, m2, m);
        addMatrix(add1, add2, m6, m);
        inMatrix(c + d22, add1, m);
 
        delete[] m1;
        delete[] m2;
        delete[] m3;
        delete[] m4;
        delete[] m5;
        delete[] m6;
        delete[] m7;
        delete[] add1;
        delete[] add2;
    }
}
 
int isPowerOf2(int n)
{
    return !(n & (n - 1));
}
 
int clp2(int n)
{
    n--;
    for (int p = 1; p < 32; p <<= 1)
        n |= (n >> p);
    return ++n;
}
 
int main()
{
    int n, * a, * b, * c, i, j;
    time_t strt, stp;
 
    srand(time(NULL));
 
    cin >> n;
 
    // n <= n2
    if (isPowerOf2(n))
        n2 = n;
    else n2 = clp2(n);
 
    s = n2 * n2;
    a = new int[s]();
    b = new int[s]();
    c = new int[s];
 
    for (i = 0; i < n; ++i)
    {
        int p = i * n2;
 
        for (j = 0; j < n; ++j)
        {
            a[p + j] = rand() % n;
            b[p + j] = rand() % n;
        }
    }
 
    outMatrix(a, n);
    outMatrix(b, n);
 
    strt = clock();
 
    strassen(c, a, b, n2);
 
    stp = clock();
 
    outMatrix(c, n);
 
    cout << (stp - strt) / CLOCKS_PER_SEC << " s (" << (stp - strt) << " ticks) for n = " << n << '\n';
 
    delete[] a;
    delete[] b;
    delete[] c;
}
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
12.12.2019, 21:19
Помогаю со студенческими работами здесь

Оптимизация программы
Ув. обыватели, Вчера написал &quot;Калькулятор&quot;, но так как я ещё зеленый в программировании на С++, прошу вас показать как и где можно...

Оптимизация программы
#include&lt;std_lib_facilities.h&gt; #include&lt;conio.h&gt; void moveHorse(int &amp;, int , int , int, int &amp;, int &amp;, int &amp;);//переставляет коня ...

Оптимизация программы на С++
Помогите оптимизировать программу на С++, я не представляю, что в ней можно изменить. Хотя бы намек на функцию, в которой нужна...

Оптимизация программы
Условие : Даны две действительные квадратные матрицы порядка n. Получить новую матрицу прибавлением к элементам каждого столбца первой...

Оптимизация программы
Здравствуйте,задали задачку :Напишите программу, которая будет выполнять последовательность запросов вида ADD num, PRESENT num и COUNT (без...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/ O1rJuneU_ls https:/ / vkvideo. ru/ video-115721503_456239114
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR ВВЕДЕНИЕ Введу сокращения: аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
Модель микоризы: классовый агентный подход 2
anaschu 06.01.2026
репозиторий https:/ / github. com/ shumilovas/ fungi ветка по-частям. коммит Create переделка под биомассу. txt вход sc, но sm считается внутри мицелия. кстати, обьем тоже должен там считаться. . . .
Расчёт токов в цепи постоянного тока
igorrr37 05.01.2026
/ * Дана цепь постоянного тока с сопротивлениями и источниками (напряжения, ЭДС и тока). Найти токи и напряжения во всех элементах. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа и. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru