Форум программистов, компьютерный форум CyberForum.ru

С++ для начинающих

Войти
Регистрация
Восстановить пароль
 
Рейтинг: Рейтинг темы: голосов - 14, средняя оценка - 4.71
mat_for_c
132 / 127 / 28
Регистрация: 26.04.2013
Сообщений: 636
Завершенные тесты: 2
#1

распараллеливание - C++

13.05.2013, 18:04. Просмотров 1940. Ответов 16
Метки нет (Все метки)

Скажите, кто-нибудь занимался распараллеливанием в си++? В моих попытках что-либо распараллелить через omp все выходило только в несколько раз медленнее. По сути у меня 8 ядер на ноуте, но их задействовать что-то не получается. По большей степени мне надо распараллеливать циклы. Если кто-то баловался этим, то помогите мне рабочим примером.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
13.05.2013, 18:04     распараллеливание
Посмотрите здесь:

Распараллеливание - C++
Всем добрый вечер. Если кто знает подскажите,мне надо распараллелить перемножение матриц,преподаватель сказал,что это делается просто с...

Распараллеливание вычислений - C++
Здравствуйте. Может кто сможет подсказать как мне решить следующую задачу: необходимо распараллелить следующий последовательный код:...

Странное распараллеливание - C++
Добрый вечер, коллеги. У меня следующая проблема. Преподаватель сказал распараллелить программу, обрабатывающую изображения в папке....

Распараллеливание алгоритмов - C++
Доброго дня всем. Встал вопрос о выборе темы,связанной с распараллеливанием алгоритмов. Какие задачи наиболее "восприимчивы" к...

Распараллеливание циклов - C++
Возникли трудности с освоением OpenMP Непонимаю, почему если закоментировать вот этот фрагмент кода, то программа работает вы разы...

Распараллеливание вычислений - C++
Вычисляю произведение матриц несколькими потоками (количество задаётся пользователем). Потоки "засыпают" на 1 мс. При вычислении...

Распараллеливание программы - C++
Помогите эту последовательную программу распараллелить на параллельных 2 процесса. #include <iostream> #include<thread> using...

После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
Кудаив
329 / 406 / 24
Регистрация: 27.05.2012
Сообщений: 1,165
Завершенные тесты: 2
13.05.2013, 18:21     распараллеливание #2
тебе нужна многопоточность, вообще многопроцессорность, но почитай про многопоточность))
Убежденный
Системный программист
Эксперт С++
15247 / 6879 / 1092
Регистрация: 02.05.2013
Сообщений: 11,256
Завершенные тесты: 1
13.05.2013, 18:34     распараллеливание #3
Можете описать на конкретных примерах, что именно не получается ?
Ternsip
660 / 188 / 6
Регистрация: 10.05.2012
Сообщений: 595
13.05.2013, 18:39     распараллеливание #4
mat_for_c, Мне 1 раз надо было сделать прекальк расстановки магарадж, так вот я врубил 8 процессов независимых и даже не парился с openmp, кстати в omp нужно очень аккуратно.
mat_for_c
132 / 127 / 28
Регистрация: 26.04.2013
Сообщений: 636
Завершенные тесты: 2
13.05.2013, 19:00  [ТС]     распараллеливание #5
Цитата Сообщение от Убежденный Посмотреть сообщение
Можете описать на конкретных примерах, что именно не получается ?
Например, мне можно распараллелить следующий цикл:
C++
1
2
3
4
5
6
7
8
9
10
11
#pragma omp parallel for
    for (i = 0; i < col_count - 1; ++i) {
        Mw[i].resize(indexW_size);
        Mnw[i].resize(indexnW_size);
        for (j = 0; j < maximum_index; ++j) {
            if (j < indexW_size)
                Mw[i][j] = Data[indexW[j]][i];
            if (j < indexnW_size)
                Mnw[i][j] = Data[indexnW[j]][i];
        }
    }
с использованием #pragma omp parallel for работает 3 миллисекунды, а без - 0. Но это пока массив данных маленький...

и еще вопрос. Если в цикле используется контейнер vector<> и его метод push_back(), то можно ли распараллелить такой цикл?
0x10
2459 / 1631 / 238
Регистрация: 24.11.2012
Сообщений: 4,009
13.05.2013, 19:24     распараллеливание #6
Цитата Сообщение от mat_for_c Посмотреть сообщение
с использованием #pragma omp parallel for работает 3 миллисекунды, а без - 0.
Объемы вычислений смешные. Классический пример - напишите перемножение матриц большого размера, проведите замеры.

Добавлено через 2 минуты
Цитата Сообщение от mat_for_c Посмотреть сообщение
и еще вопрос. Если в цикле используется контейнер vector<> и его метод push_back(), то можно ли распараллелить такой цикл?
Этот метод не является потокобезопасным.
mat_for_c
132 / 127 / 28
Регистрация: 26.04.2013
Сообщений: 636
Завершенные тесты: 2
13.05.2013, 20:00  [ТС]     распараллеливание #7
Цитата Сообщение от 0x10 Посмотреть сообщение
Объемы вычислений смешные. Классический пример - напишите перемножение матриц большого размера, проведите замеры.
Сделал ... Вот результаты
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
#include <iostream>
#include <ctime>
#include <omp.h>
 
using namespace std;
 
int main(void)
{
    srand(time(NULL));
    short a[2000][100], b[100][3000];//, p[2000][3000]; --- места на него не хватило :)
    int i, j, k, sum;
    for (i = 0; i < 2000; ++i)
        for (j = 0; j < 100; ++j) {
            a[i][j] = rand()%10;
        }
    for (i = 0; i < 100; ++i)
        for (j = 0; j < 3000; ++j) {
            b[i][j] = rand()%10;
        }
    
    //без  -- 2096 мс
    clock_t beg = clock();
//#pragma omp parallel for -- 9297 мс
    for (i = 0; i < 2000; ++i) {
    //#pragma omp parallel for  //-- 5439 мс
        for (j = 0; j < 3000; ++j) {
            sum = 0;
            //#pragma omp parallel for // оооочень долго
            for (k = 0 ; k < 100; ++k)
                sum += a[i][k]*b[k][j];
            //p[i][j] = sum; - т.к. массива нет
        }
    }
    clock_t end = clock();
    cout << end - beg << endl;
    system("pause");
    return 0;
}
время указано там, где использовался omp для конкретного цикла. почему такие результаты большие???
0x10
2459 / 1631 / 238
Регистрация: 24.11.2012
Сообщений: 4,009
13.05.2013, 20:29     распараллеливание #8
Цитата Сообщение от mat_for_c Посмотреть сообщение
p[2000][3000]; --- места на него не хватило
Ну сделайте ж динамическое выделение памяти.

Функция clock ситает процессорное время. Воспользуйтесь какой-нибудь gettimeofday.
mat_for_c
132 / 127 / 28
Регистрация: 26.04.2013
Сообщений: 636
Завершенные тесты: 2
14.05.2013, 11:30  [ТС]     распараллеливание #9
Цитата Сообщение от 0x10 Посмотреть сообщение
Ну сделайте ж динамическое выделение памяти.
Это не особо важно. Основной смысл перемножения расписан.


Цитата Сообщение от 0x10 Посмотреть сообщение
Функция clock ситает процессорное время. Воспользуйтесь какой-нибудь gettimeofday.
как я понял, gettimeofday в линуксе работает, в то время как у меня винда стоит, да и в статье про нее писали, что все же лучше получить процессорное время...
http://ccfit.nsu.ru/~kireev/lab1/lab1time.htm
castaway
Эксперт С++
4881 / 3017 / 370
Регистрация: 10.11.2010
Сообщений: 11,076
Записей в блоге: 10
Завершенные тесты: 1
14.05.2013, 12:00     распараллеливание #10
Время можно замерить при помощи самого OpenMP.
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
#include <omp.h>
#include <cstdio>
#include <cmath>
 
int main()
{
    double  start;
    double  result[8];
 
    start = omp_get_wtime();
 
    #pragma omp parallel for
    for ( int i = 0; i < 8; i++ ) {
        result[i] = 0;
        for ( int j = 0; j < 1000000; j++ ) {
            result[i] += (pow( i + 1, 1.1 )) * sqrt( i * j );
        }
    }
 
    printf( "Elapsed = %.2f\n", omp_get_wtime() - start );
 
    for ( int i = 0; i < 8; i++ ) {
        printf( "%2d: %.4f\n", i, result[i] );
    }
 
    return 0;
}
0x10
2459 / 1631 / 238
Регистрация: 24.11.2012
Сообщений: 4,009
14.05.2013, 12:06     распараллеливание #11
mat_for_c, в статье говорится о времени процесса - т.е. о том времени, которое процесс занимал процессор. Оно точнее отражает время выполнения программы в многозадачной системе по сравнению с системным временем.

Функция clock возвращает количество тиков процессора. Т.е. если параллельно выполнялось два потока и время первого N, второго - K, то с использованием функции clock получим N+K.

Ну выше уже написали, что в openmp есть функция для измерения времени.
mat_for_c
132 / 127 / 28
Регистрация: 26.04.2013
Сообщений: 636
Завершенные тесты: 2
14.05.2013, 18:47  [ТС]     распараллеливание #12
lazybiz, а правильно ли я понимаю, что небольшие циклы распараллеливать смысла нет? скажем в вашем примере я j изменял до 1000 и при использовании omp работало только медленнее...
castaway
Эксперт С++
4881 / 3017 / 370
Регистрация: 10.11.2010
Сообщений: 11,076
Записей в блоге: 10
Завершенные тесты: 1
14.05.2013, 21:54     распараллеливание #13
Цитата Сообщение от mat_for_c Посмотреть сообщение
а правильно ли я понимаю, что небольшие циклы распараллеливать смысла нет? скажем в вашем примере я j изменял до 1000 и при использовании omp работало только медленнее...
Внутренний цикл с переменной j не распараллеливается. Поэтому, скорее всего, вы меня поняли не правильно.
В данном примере распараллеливается только цикл с переменной i. Поэтому, если у цикла как минимум 2 итерации, то есть смысл его распараллелить.
mat_for_c
132 / 127 / 28
Регистрация: 26.04.2013
Сообщений: 636
Завершенные тесты: 2
14.05.2013, 22:12  [ТС]     распараллеливание #14
Цитата Сообщение от lazybiz Посмотреть сообщение
Внутренний цикл с переменной j не распараллеливается. Поэтому, скорее всего, вы меня поняли не правильно.
Я параллелил внешний цикл, но при условии, что j меняется до 1000, а не до 1000000. При этом время работы ухудшалось. Попробуйте пожалуйста проделать то же самое и дайте ответ, какие у Вас результаты и что Вы думаете по этому поводу.
castaway
Эксперт С++
4881 / 3017 / 370
Регистрация: 10.11.2010
Сообщений: 11,076
Записей в блоге: 10
Завершенные тесты: 1
14.05.2013, 22:32     распараллеливание #15
У меня с 0 <= j < 1000, независимо от того, использую я OpenMP или нет, результат времени == 0. Т.е. это слишком "слабый" цикл.
Я понял что вы имеете в виду. Разумеется, что если вам заранее известно, что цикл занимает очень мало процессорного времени, то нет смысла его распаралелливать.
DU
1480 / 1056 / 45
Регистрация: 05.12.2011
Сообщений: 2,279
15.05.2013, 00:07     распараллеливание #16
разные алгоритмы параллелятся с разной эффективностью. Тут смотреть как оно все масштабируется, что,
что там со всякими кеш промахами, какова нагрузка на шину данных и прочее.
Вот пример тестиков немного разных циклов, запущенных в ДЕБАГЕ 12 студии (в релизе совсем другие цифры, т.к. код другой и распараллелилось соответственно по другому):


Max threads = 8

###################################
Test1:
serial time = 0.00319136
parallel time = 0.0707065
serial/parallel = 0.0451353

###################################
Test2:
serial time = 3.358
parallel time = 1.0248
serial/parallel = 3.27672

###################################
Test3:
serial time = 2.45181
parallel time = 0.722106
serial/parallel = 3.39536

Press any key to continue . . .


C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
#include <omp.h>
 
#include <vector>
#include <iostream>
 
 
class TimeMeasurement
{
public:
  TimeMeasurement()
    : m_begin(omp_get_wtime())
  {
  }
 
  void Reset()
  {
    m_begin = omp_get_wtime();
  }
 
  double Elapsed() const
  {
    return omp_get_wtime() - m_begin;
  }
 
private:
  double m_begin;
};
 
 
typedef std::vector< std::vector<int> > Matrix;
 
Matrix CreateMatrix(unsigned w, unsigned h)
{
  return Matrix(h, std::vector<int>(w, 0));
}
 
 
void Test1()
{
  const unsigned side = 100;
  Matrix a = CreateMatrix(side, side);
  Matrix b = CreateMatrix(side, side);
  Matrix c = CreateMatrix(side, side);
 
  TimeMeasurement timeMeasurement;
 
 
  timeMeasurement.Reset();
 
  for (unsigned i = 0; i < side; ++i)
  {
    for (unsigned j = 0; j < side; ++j)
    {
      c[i][j] += a[i][j] * b[i][j];
    }
  }
 
  const double serialTime = timeMeasurement.Elapsed();
 
 
  timeMeasurement.Reset();
 
 
  #pragma omp parallel for
  for (int i = 0; i < side; ++i)
  {
    for (unsigned j = 0; j < side; ++j)
    {
      c[i][j] = a[i][j] * b[i][j];
    }
  }
 
  const double parallelTime = timeMeasurement.Elapsed();
 
  std::cout << "###################################" << std::endl;
  std::cout << "Test1:" << std::endl;
  std::cout << "serial   time   = " << serialTime << std::endl;
  std::cout << "parallel time   = " << parallelTime << std::endl;
  if (parallelTime > 0.0000001)
  {
    std::cout << "serial/parallel = " << serialTime / parallelTime << std::endl;
  }
  std::cout << std::endl;
}
 
void Test2()
{
  const unsigned side = 100;
  Matrix a = CreateMatrix(side, side);
  Matrix b = CreateMatrix(side, side);
  Matrix c = CreateMatrix(side, side);
 
  TimeMeasurement timeMeasurement;
 
 
  timeMeasurement.Reset();
 
  for (unsigned i = 0; i < side; ++i)
  {
    for (unsigned j = 0; j < side; ++j)
    {
      for (int k = 0; k < 1000; ++k)
      {
        c[i][j] = a[i][j] * b[i][j];
      }
    }
  }
 
  const double serialTime = timeMeasurement.Elapsed();
 
 
  timeMeasurement.Reset();
 
 
  #pragma omp parallel for
  for (int i = 0; i < side; ++i)
  {
    for (unsigned j = 0; j < side; ++j)
    {
      for (int k = 0; k < 1000; ++k)
      {
        c[i][j] = a[i][j] * b[i][j];
      }
    }
  }
 
  const double parallelTime = timeMeasurement.Elapsed();
 
  std::cout << "###################################" << std::endl;
  std::cout << "Test2:" << std::endl;
  std::cout << "serial   time   = " << serialTime << std::endl;
  std::cout << "parallel time   = " << parallelTime << std::endl;
  if (parallelTime > 0.0000001)
  {
    std::cout << "serial/parallel = " << serialTime / parallelTime << std::endl;
  }
  std::cout << std::endl;
}
 
void Test3()
{
  const unsigned side = 100;
  Matrix a = CreateMatrix(side, side);
  Matrix b = CreateMatrix(side, side);
  Matrix c = CreateMatrix(side, side);
 
  TimeMeasurement timeMeasurement;
 
 
  timeMeasurement.Reset();
 
  for (unsigned i = 0; i < side; ++i)
  {
    for (unsigned j = 0; j < side; ++j)
    {
      const int aa = a[i][j];
      const int bb = b[i][j];
      int cc = 0;
      for (int k = 0; k < 100000; ++k)
      {
        cc += aa * bb;
      }
      c[i][j] = cc;
    }
  }
 
  const double serialTime = timeMeasurement.Elapsed();
 
 
  timeMeasurement.Reset();
 
 
  #pragma omp parallel for
  for (int i = 0; i < side; ++i)
  {
    for (unsigned j = 0; j < side; ++j)
    {
      const int aa = a[i][j];
      const int bb = b[i][j];
      int cc = 0;
      for (int k = 0; k < 100000; ++k)
      {
        cc += aa * bb;
      }
      c[i][j] = cc;
    }
  }
 
  const double parallelTime = timeMeasurement.Elapsed();
 
  std::cout << "###################################" << std::endl;
  std::cout << "Test3:" << std::endl;
  std::cout << "serial   time   = " << serialTime << std::endl;
  std::cout << "parallel time   = " << parallelTime << std::endl;
  if (parallelTime > 0.0000001)
  {
    std::cout << "serial/parallel = " << serialTime / parallelTime << std::endl;
  }
  std::cout << std::endl;
}
 
int main()
{
  std::cout << "Max threads = " << omp_get_max_threads() << std::endl << std::endl;
  Test1();
  Test2();
  Test3();
  return 0;
}
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
15.05.2013, 00:59     распараллеливание
Еще ссылки по теме:

Распараллеливание через omp.h - C++
// labaOMP.cpp: определяет точку входа для консольного приложения. // #include &quot;stdafx.h&quot; #include &lt;iostream&gt; #include &lt;omp.h&gt; ...

Распараллеливание арифметических выражений - C++
Здравствуйте. Есть задача - распараллелить вычисление арифмитического выражения, подобное виду (a+b)+(c+(d+e+f))+h т.е....

Распараллеливание с помощью OpenMP - C++
Здравствуйте, уважаемые участники форума! Имеется цикл вида:for (i=1; i&lt;number; i++) { do something; }Цикл выполняется...

Работа с OpenMP. Распараллеливание цикла for - C++
Доброго времени суток товарищи. При работе с OpenMP возник следующий вопрос Почему код int i; int Mass={0}; ...

OpenIM - не работает распараллеливание циклов - C++
void Multiplication(int a, int b) { int c; int i; int j; int count(0); omp_set_num_threads(count); #pragma omp...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
mat_for_c
132 / 127 / 28
Регистрация: 26.04.2013
Сообщений: 636
Завершенные тесты: 2
15.05.2013, 00:59  [ТС]     распараллеливание #17
Цитата Сообщение от DU Посмотреть сообщение
в релизе совсем другие цифры, т.к. код другой и распараллелилось соответственно по другому
прикольно... в релизе через omp быстрее отработал 1 тест, а остальные остались почти такими же, как без omp.
так это что получается? если делать релизную версию, то там только для малых входных данных распараллеливание хорошо работает?
Yandex
Объявления
15.05.2013, 00:59     распараллеливание
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru