Форум программистов, компьютерный форум, киберфорум
C++
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.52/29: Рейтинг темы: голосов - 29, средняя оценка - 4.52
2 / 2 / 0
Регистрация: 18.09.2021
Сообщений: 418

параллелизм в с++, используя OpenML

01.12.2023, 16:43. Показов 6354. Ответов 4
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте, нужна помощь для оптимизации алгоритма решения СЛАУ методом Гаусса, ниже приведу стандартный алгоритм:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
#include <iostream>
#include <chrono>
 
void gaussElimination(double** A, double* b, int n) {
    for (int i = 0; i < n; ++i) {
        for (int j = i + 1; j < n; ++j) {
            double factor = A[j][i] / A[i][i];
            b[j] -= factor * b[i];
            for (int k = i; k < n; ++k) {
                A[j][k] -= factor * A[i][k];
            }
        }
    }
 
    double* x = new double[n];
    for (int i = n - 1; i >= 0; --i) {
        double sum = 0.0;
        for (int j = i + 1; j < n; ++j) {
            sum += A[i][j] * x[j];
        }
        x[i] = (b[i] - sum) / A[i][i];
    }
 
    std::cout << "Решение x:\n";
    for (int i = 0; i < n; ++i) {
        std::cout << x[i] << " ";
    }
    std::cout << std::endl;
 
    delete[] x;
}
 
int main() {
    setlocale(LC_ALL, "rus");
    int n = 2000;
 
    double** A = new double* [n];
    double* b = new double[n];
 
    for (int i = 0; i < n; ++i) {
        A[i] = new double[n];
        for (int j = 0; j < n; ++j) {
            A[i][j] = 1.0 + static_cast<double>(rand()) / (RAND_MAX / 9.0);
        }
        b[i] = 1.0 + static_cast<double>(rand()) / (RAND_MAX / 9.0);
    }
 
    auto start = std::chrono::high_resolution_clock::now();
 
    gaussElimination(A, b, n);
 
    auto end = std::chrono::high_resolution_clock::now();
    std::chrono::duration<double> duration = end - start;
    std::cout << "Время выполнения: " << duration.count() << " секунд." << std::endl;
 
    for (int i = 0; i < n; ++i) {
        delete[] A[i];
    }
    delete[] A;
    delete[] b;
 
    return 0;
}
я пытаюсь оптимизировать алгоритм, используя параллелизм, тем самым использую библиотеку OpenMP. можете пожалуйста помочь с этим?
пока что набросал что-то такое:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
#include <iostream>
#include <chrono>
#include <omp.h>
 
void gaussElimination(double** A, double* b, int n) {
    #pragma omp parallel for
    for (int i = 0; i < n; ++i) {
        #pragma omp parallel for
        for (int j = i + 1; j < n; ++j) {
            double factor = A[j][i] / A[i][i];
            b[j] -= factor * b[i];
            #pragma omp parallel for
            for (int k = i; k < n; ++k) {
                A[j][k] -= factor * A[i][k];
            }
        }
    }
 
    double* x = new double[n];
    #pragma omp parallel for
    for (int i = n - 1; i >= 0; --i) {
        double sum = 0.0;
        #pragma omp parallel for reduction(+:sum)
        for (int j = i + 1; j < n; ++j) {
            sum += A[i][j] * x[j];
        }
        x[i] = (b[i] - sum) / A[i][i];
    }
 
    std::cout << "Решение x:\n";
    for (int i = 0; i < n; ++i) {
        std::cout << x[i] << " ";
    }
    std::cout << std::endl;
 
    delete[] x;
}
 
int main() {
    setlocale(LC_ALL, "rus");
    int n = 2000;
 
    double** A = new double*[n];
    double* b = new double[n];
 
    for (int i = 0; i < n; ++i) {
        A[i] = new double[n];
        for (int j = 0; j < n; ++j) {
            A[i][j] = 1.0 + static_cast<double>(rand()) / (RAND_MAX / 9.0);
        }
        b[i] = 1.0 + static_cast<double>(rand()) / (RAND_MAX / 9.0);
    }
 
    auto start = std::chrono::high_resolution_clock::now();
 
    gaussElimination(A, b, n);
 
    auto end = std::chrono::high_resolution_clock::now();
    std::chrono::duration<double> duration = end - start;
    std::cout << "Время выполнения: " << duration.count() << " секунд." << std::endl;
 
    for (int i = 0; i < n; ++i) {
        delete[] A[i];
    }
    delete[] A;
    delete[] b;
 
    return 0;
}
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
01.12.2023, 16:43
Ответы с готовыми решениями:

Параллелизм
Здравствуйте. Я уже один раз обращался за помощью, мне очень хорошо помогли! Спасибо большое oleg-m1973 Я хотел бы сделать мой...

Параллелизм
Добрый день, по рекомендуйте хорошую литературу с примерами для работы с Параллелизмом в C#

Рекурсивный параллелизм
Есть код сортировки нужно преобразовать программу для использования рекурсивного параллелизма, как это реализовать? заранее спасибо. ...

4
 Аватар для igorrr37
2870 / 2017 / 991
Регистрация: 21.12.2010
Сообщений: 3,728
Записей в блоге: 15
02.12.2023, 14:57
используя std::async или std::thresd. Чуть ускоряет.
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
#include <iostream>
#include <chrono>
#include <cstdlib>
#include <atomic>
#include <thread>
#include <vector>
#include <condition_variable>
#include <mutex>
#include <barrier>
#include <future>
 
int n, ind;
std::atomic_int aj;
int tc = std::thread::hardware_concurrency();
bool stop = false;
std::condition_variable cv;
std::mutex mx;
std::barrier br{ tc + 1 };
std::vector<bool> vStart(tc, false);
 
void funcThread(double** A, double* b, int t)
{
    while (!stop)
    {
        {
            std::unique_lock ul{ mx };
            cv.wait(ul, [t]() { return vStart[t]; });
            vStart[t] = false;
        }
        for (int j = aj++; j < n; j = aj++)
        {
            double factor = A[j][ind] / A[ind][ind];
            b[j] -= factor * b[ind];
            for (int k = ind; k < n; ++k)
            {
                A[j][k] -= factor * A[ind][k];
            }
        }
        br.arrive();
    }
}
 
std::vector<std::future<void>> vf;
void funcAsync(double** A, double* b)
{
    for (int j = aj++; j < n; j = aj++)
    {
        double factor = A[j][ind] / A[ind][ind];
        b[j] -= factor * b[ind];
        for (int k = ind; k < n; ++k)
        {
            A[j][k] -= factor * A[ind][k];
        }
    }
}
 
void gaussElimination(double** A, double* b, int n) 
{
    auto start = std::chrono::high_resolution_clock::now();
    for (int i = 0; i < n; ++i) 
    {
        ///* // потоки через std::thread
        {
            std::lock_guard lg{ mx };
            ind = i;
            aj = i + 1;
            for (int i = 0; i < vStart.size(); ++i)
            {
                vStart[i] = true;
            }
        }
        cv.notify_all();
        br.arrive_and_wait();
        //*/
 
        /* // потоки через std::async
        ind = i;
        aj = i + 1;
        vf.clear();
        for (int t = 0; t < tc; ++t)
        {
            vf.emplace_back(std::async(std::launch::async, funcAsync, A, b));
        }
        for (auto& f : vf)
        {
            f.get();
        }
        */
 
        /* // без потоков
        for (int j = i + 1; j < n; ++j) 
        {
            double factor = A[j][i] / A[i][i];
            b[j] -= factor * b[i];
            for (int k = i; k < n; ++k) 
            {
                A[j][k] -= factor * A[i][k];
            }
        }
        */
    }
    auto end = std::chrono::high_resolution_clock::now();
    std::chrono::duration<double> duration = end - start;
 
    double* x = new double[n];
    for (int i = n - 1; i >= 0; --i) 
    {
        double sum = 0.0;
        for (int j = i + 1; j < n; ++j) 
        {
            sum += A[i][j] * x[j];
        }
        x[i] = (b[i] - sum) / A[i][i];
    }
 
    std::cout << "Решение x:\n";
    for (int i = 0; i < n; ++i) 
    {
        std::cout << x[i] << " ";
    }
    std::cout << std::endl;
 
    delete[] x;
    std::cout << "Время выполнения: " << duration.count() << " секунд." << std::endl;
}
 
int main() 
{
    system("chcp 1251 > 0");
    n = 3000;
 
    double** A = new double* [n];
    double* b = new double[n];
 
    for (int i = 0; i < n; ++i) 
    {
        A[i] = new double[n];
        for (int j = 0; j < n; ++j) 
        {
            A[i][j] = 1.0 + static_cast<double>(rand()) / (RAND_MAX / 9.0);
        }
        b[i] = 1.0 + static_cast<double>(rand()) / (RAND_MAX / 9.0);
    }
 
    std::vector<std::thread> vt;
    for (int i = 0; i < tc; ++i)
    {
        vt.emplace_back(funcThread, A, b, i);
    }
 
    gaussElimination(A, b, n);
 
    {
        std::lock_guard lg{ mx };
        stop = true;
        for (int i = 0; i < vStart.size(); ++i)
        {
            vStart[i] = true;
        }
    }
    cv.notify_all();
    for (auto& t : vt)
    {
        t.join();
    }
 
    for (int i = 0; i < n; ++i)
    {
        delete[] A[i];
    }
    delete[] A;
    delete[] b;
}
0
2 / 2 / 0
Регистрация: 18.09.2021
Сообщений: 418
02.12.2023, 14:58  [ТС]
igorrr37, я запускаю на линукс, используя один поток процессора. синхронизация тут не помогает
0
 Аватар для igorrr37
2870 / 2017 / 991
Регистрация: 21.12.2010
Сообщений: 3,728
Записей в блоге: 15
02.12.2023, 15:05
Цитата Сообщение от volver Посмотреть сообщение
один поток процессора. синхронизация тут не помогает
если будет больше потоков то поможет
0
2 / 2 / 0
Регистрация: 18.09.2021
Сообщений: 418
02.12.2023, 15:06  [ТС]
igorrr37, это понятно, что поможет. но нужно оптимизировать именно на одном потоке
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
02.12.2023, 15:06
Помогаю со студенческими работами здесь

Рекурсивный параллелизм
Всем доброго времени суток! Я полагаю, что подобный вопрос уже задавался (в интернетах в целом), однако прямого ответа я найти не смог, а...

Параллелизм (заполнение массива)
Здравствуйте! только начинаю пробовать распараллеливание своих программ. не могу понять, какова проблема этого участка кода: int...

Оптимистичный параллелизм и типизированный DataSet
может кто подскажет как такое сделать с типизированным ДатаСет. В схеме *.xsd в свойствах TableAdapter Configuraton Wizard в AdvancedOption...

Параллелизм данных (СЛАУ методом Гаусса)
Здравствуйте. Есть готовый код для решения системы линейных уравнений (СЛАУ) методом Гаусса. Нужно только как-то применить параллелизм...

Параллелизм в задачах моделирования физических процессов
Добрый день, форум! Возник вопрос, кто-нибудь тспользовал многопоточность в задачах моделлирования движения объектов? Типа...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru