Форум программистов, компьютерный форум CyberForum.ru

С++ для начинающих

Войти
Регистрация
Восстановить пароль
 
Рейтинг: Рейтинг темы: голосов - 14, средняя оценка - 4.71
mat_for_c
 Аватар для mat_for_c
120 / 115 / 21
Регистрация: 26.04.2013
Сообщений: 597
Завершенные тесты: 2
#1

распараллеливание - C++

13.05.2013, 18:04. Просмотров 1797. Ответов 16
Метки нет (Все метки)

Скажите, кто-нибудь занимался распараллеливанием в си++? В моих попытках что-либо распараллелить через omp все выходило только в несколько раз медленнее. По сути у меня 8 ядер на ноуте, но их задействовать что-то не получается. По большей степени мне надо распараллеливать циклы. Если кто-то баловался этим, то помогите мне рабочим примером.
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
Кудаив
329 / 406 / 24
Регистрация: 27.05.2012
Сообщений: 1,164
Завершенные тесты: 2
13.05.2013, 18:21     распараллеливание #2
тебе нужна многопоточность, вообще многопроцессорность, но почитай про многопоточность))
Убежденный
Системный программист
 Аватар для Убежденный
14626 / 6587 / 1043
Регистрация: 02.05.2013
Сообщений: 10,858
Завершенные тесты: 1
13.05.2013, 18:34     распараллеливание #3
Можете описать на конкретных примерах, что именно не получается ?
Ternsip
 Аватар для Ternsip
660 / 188 / 6
Регистрация: 10.05.2012
Сообщений: 595
13.05.2013, 18:39     распараллеливание #4
mat_for_c, Мне 1 раз надо было сделать прекальк расстановки магарадж, так вот я врубил 8 процессов независимых и даже не парился с openmp, кстати в omp нужно очень аккуратно.
mat_for_c
 Аватар для mat_for_c
120 / 115 / 21
Регистрация: 26.04.2013
Сообщений: 597
Завершенные тесты: 2
13.05.2013, 19:00  [ТС]     распараллеливание #5
Цитата Сообщение от Убежденный Посмотреть сообщение
Можете описать на конкретных примерах, что именно не получается ?
Например, мне можно распараллелить следующий цикл:
C++
1
2
3
4
5
6
7
8
9
10
11
#pragma omp parallel for
    for (i = 0; i < col_count - 1; ++i) {
        Mw[i].resize(indexW_size);
        Mnw[i].resize(indexnW_size);
        for (j = 0; j < maximum_index; ++j) {
            if (j < indexW_size)
                Mw[i][j] = Data[indexW[j]][i];
            if (j < indexnW_size)
                Mnw[i][j] = Data[indexnW[j]][i];
        }
    }
с использованием #pragma omp parallel for работает 3 миллисекунды, а без - 0. Но это пока массив данных маленький...

и еще вопрос. Если в цикле используется контейнер vector<> и его метод push_back(), то можно ли распараллелить такой цикл?
0x10
2442 / 1614 / 235
Регистрация: 24.11.2012
Сообщений: 3,962
13.05.2013, 19:24     распараллеливание #6
Цитата Сообщение от mat_for_c Посмотреть сообщение
с использованием #pragma omp parallel for работает 3 миллисекунды, а без - 0.
Объемы вычислений смешные. Классический пример - напишите перемножение матриц большого размера, проведите замеры.

Добавлено через 2 минуты
Цитата Сообщение от mat_for_c Посмотреть сообщение
и еще вопрос. Если в цикле используется контейнер vector<> и его метод push_back(), то можно ли распараллелить такой цикл?
Этот метод не является потокобезопасным.
mat_for_c
 Аватар для mat_for_c
120 / 115 / 21
Регистрация: 26.04.2013
Сообщений: 597
Завершенные тесты: 2
13.05.2013, 20:00  [ТС]     распараллеливание #7
Цитата Сообщение от 0x10 Посмотреть сообщение
Объемы вычислений смешные. Классический пример - напишите перемножение матриц большого размера, проведите замеры.
Сделал ... Вот результаты
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
#include <iostream>
#include <ctime>
#include <omp.h>
 
using namespace std;
 
int main(void)
{
    srand(time(NULL));
    short a[2000][100], b[100][3000];//, p[2000][3000]; --- места на него не хватило :)
    int i, j, k, sum;
    for (i = 0; i < 2000; ++i)
        for (j = 0; j < 100; ++j) {
            a[i][j] = rand()%10;
        }
    for (i = 0; i < 100; ++i)
        for (j = 0; j < 3000; ++j) {
            b[i][j] = rand()%10;
        }
    
    //без  -- 2096 мс
    clock_t beg = clock();
//#pragma omp parallel for -- 9297 мс
    for (i = 0; i < 2000; ++i) {
    //#pragma omp parallel for  //-- 5439 мс
        for (j = 0; j < 3000; ++j) {
            sum = 0;
            //#pragma omp parallel for // оооочень долго
            for (k = 0 ; k < 100; ++k)
                sum += a[i][k]*b[k][j];
            //p[i][j] = sum; - т.к. массива нет
        }
    }
    clock_t end = clock();
    cout << end - beg << endl;
    system("pause");
    return 0;
}
время указано там, где использовался omp для конкретного цикла. почему такие результаты большие???
0x10
2442 / 1614 / 235
Регистрация: 24.11.2012
Сообщений: 3,962
13.05.2013, 20:29     распараллеливание #8
Цитата Сообщение от mat_for_c Посмотреть сообщение
p[2000][3000]; --- места на него не хватило
Ну сделайте ж динамическое выделение памяти.

Функция clock ситает процессорное время. Воспользуйтесь какой-нибудь gettimeofday.
mat_for_c
 Аватар для mat_for_c
120 / 115 / 21
Регистрация: 26.04.2013
Сообщений: 597
Завершенные тесты: 2
14.05.2013, 11:30  [ТС]     распараллеливание #9
Цитата Сообщение от 0x10 Посмотреть сообщение
Ну сделайте ж динамическое выделение памяти.
Это не особо важно. Основной смысл перемножения расписан.


Цитата Сообщение от 0x10 Посмотреть сообщение
Функция clock ситает процессорное время. Воспользуйтесь какой-нибудь gettimeofday.
как я понял, gettimeofday в линуксе работает, в то время как у меня винда стоит, да и в статье про нее писали, что все же лучше получить процессорное время...
http://ccfit.nsu.ru/~kireev/lab1/lab1time.htm
castaway
Эксперт С++
4869 / 3008 / 370
Регистрация: 10.11.2010
Сообщений: 11,059
Записей в блоге: 10
Завершенные тесты: 1
14.05.2013, 12:00     распараллеливание #10
Время можно замерить при помощи самого OpenMP.
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
#include <omp.h>
#include <cstdio>
#include <cmath>
 
int main()
{
    double  start;
    double  result[8];
 
    start = omp_get_wtime();
 
    #pragma omp parallel for
    for ( int i = 0; i < 8; i++ ) {
        result[i] = 0;
        for ( int j = 0; j < 1000000; j++ ) {
            result[i] += (pow( i + 1, 1.1 )) * sqrt( i * j );
        }
    }
 
    printf( "Elapsed = %.2f\n", omp_get_wtime() - start );
 
    for ( int i = 0; i < 8; i++ ) {
        printf( "%2d: %.4f\n", i, result[i] );
    }
 
    return 0;
}
0x10
2442 / 1614 / 235
Регистрация: 24.11.2012
Сообщений: 3,962
14.05.2013, 12:06     распараллеливание #11
mat_for_c, в статье говорится о времени процесса - т.е. о том времени, которое процесс занимал процессор. Оно точнее отражает время выполнения программы в многозадачной системе по сравнению с системным временем.

Функция clock возвращает количество тиков процессора. Т.е. если параллельно выполнялось два потока и время первого N, второго - K, то с использованием функции clock получим N+K.

Ну выше уже написали, что в openmp есть функция для измерения времени.
mat_for_c
 Аватар для mat_for_c
120 / 115 / 21
Регистрация: 26.04.2013
Сообщений: 597
Завершенные тесты: 2
14.05.2013, 18:47  [ТС]     распараллеливание #12
lazybiz, а правильно ли я понимаю, что небольшие циклы распараллеливать смысла нет? скажем в вашем примере я j изменял до 1000 и при использовании omp работало только медленнее...
castaway
Эксперт С++
4869 / 3008 / 370
Регистрация: 10.11.2010
Сообщений: 11,059
Записей в блоге: 10
Завершенные тесты: 1
14.05.2013, 21:54     распараллеливание #13
Цитата Сообщение от mat_for_c Посмотреть сообщение
а правильно ли я понимаю, что небольшие циклы распараллеливать смысла нет? скажем в вашем примере я j изменял до 1000 и при использовании omp работало только медленнее...
Внутренний цикл с переменной j не распараллеливается. Поэтому, скорее всего, вы меня поняли не правильно.
В данном примере распараллеливается только цикл с переменной i. Поэтому, если у цикла как минимум 2 итерации, то есть смысл его распараллелить.
mat_for_c
 Аватар для mat_for_c
120 / 115 / 21
Регистрация: 26.04.2013
Сообщений: 597
Завершенные тесты: 2
14.05.2013, 22:12  [ТС]     распараллеливание #14
Цитата Сообщение от lazybiz Посмотреть сообщение
Внутренний цикл с переменной j не распараллеливается. Поэтому, скорее всего, вы меня поняли не правильно.
Я параллелил внешний цикл, но при условии, что j меняется до 1000, а не до 1000000. При этом время работы ухудшалось. Попробуйте пожалуйста проделать то же самое и дайте ответ, какие у Вас результаты и что Вы думаете по этому поводу.
castaway
Эксперт С++
4869 / 3008 / 370
Регистрация: 10.11.2010
Сообщений: 11,059
Записей в блоге: 10
Завершенные тесты: 1
14.05.2013, 22:32     распараллеливание #15
У меня с 0 <= j < 1000, независимо от того, использую я OpenMP или нет, результат времени == 0. Т.е. это слишком "слабый" цикл.
Я понял что вы имеете в виду. Разумеется, что если вам заранее известно, что цикл занимает очень мало процессорного времени, то нет смысла его распаралелливать.
DU
1479 / 1055 / 45
Регистрация: 05.12.2011
Сообщений: 2,279
15.05.2013, 00:07     распараллеливание #16
разные алгоритмы параллелятся с разной эффективностью. Тут смотреть как оно все масштабируется, что,
что там со всякими кеш промахами, какова нагрузка на шину данных и прочее.
Вот пример тестиков немного разных циклов, запущенных в ДЕБАГЕ 12 студии (в релизе совсем другие цифры, т.к. код другой и распараллелилось соответственно по другому):


Max threads = 8

###################################
Test1:
serial time = 0.00319136
parallel time = 0.0707065
serial/parallel = 0.0451353

###################################
Test2:
serial time = 3.358
parallel time = 1.0248
serial/parallel = 3.27672

###################################
Test3:
serial time = 2.45181
parallel time = 0.722106
serial/parallel = 3.39536

Press any key to continue . . .


C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
#include <omp.h>
 
#include <vector>
#include <iostream>
 
 
class TimeMeasurement
{
public:
  TimeMeasurement()
    : m_begin(omp_get_wtime())
  {
  }
 
  void Reset()
  {
    m_begin = omp_get_wtime();
  }
 
  double Elapsed() const
  {
    return omp_get_wtime() - m_begin;
  }
 
private:
  double m_begin;
};
 
 
typedef std::vector< std::vector<int> > Matrix;
 
Matrix CreateMatrix(unsigned w, unsigned h)
{
  return Matrix(h, std::vector<int>(w, 0));
}
 
 
void Test1()
{
  const unsigned side = 100;
  Matrix a = CreateMatrix(side, side);
  Matrix b = CreateMatrix(side, side);
  Matrix c = CreateMatrix(side, side);
 
  TimeMeasurement timeMeasurement;
 
 
  timeMeasurement.Reset();
 
  for (unsigned i = 0; i < side; ++i)
  {
    for (unsigned j = 0; j < side; ++j)
    {
      c[i][j] += a[i][j] * b[i][j];
    }
  }
 
  const double serialTime = timeMeasurement.Elapsed();
 
 
  timeMeasurement.Reset();
 
 
  #pragma omp parallel for
  for (int i = 0; i < side; ++i)
  {
    for (unsigned j = 0; j < side; ++j)
    {
      c[i][j] = a[i][j] * b[i][j];
    }
  }
 
  const double parallelTime = timeMeasurement.Elapsed();
 
  std::cout << "###################################" << std::endl;
  std::cout << "Test1:" << std::endl;
  std::cout << "serial   time   = " << serialTime << std::endl;
  std::cout << "parallel time   = " << parallelTime << std::endl;
  if (parallelTime > 0.0000001)
  {
    std::cout << "serial/parallel = " << serialTime / parallelTime << std::endl;
  }
  std::cout << std::endl;
}
 
void Test2()
{
  const unsigned side = 100;
  Matrix a = CreateMatrix(side, side);
  Matrix b = CreateMatrix(side, side);
  Matrix c = CreateMatrix(side, side);
 
  TimeMeasurement timeMeasurement;
 
 
  timeMeasurement.Reset();
 
  for (unsigned i = 0; i < side; ++i)
  {
    for (unsigned j = 0; j < side; ++j)
    {
      for (int k = 0; k < 1000; ++k)
      {
        c[i][j] = a[i][j] * b[i][j];
      }
    }
  }
 
  const double serialTime = timeMeasurement.Elapsed();
 
 
  timeMeasurement.Reset();
 
 
  #pragma omp parallel for
  for (int i = 0; i < side; ++i)
  {
    for (unsigned j = 0; j < side; ++j)
    {
      for (int k = 0; k < 1000; ++k)
      {
        c[i][j] = a[i][j] * b[i][j];
      }
    }
  }
 
  const double parallelTime = timeMeasurement.Elapsed();
 
  std::cout << "###################################" << std::endl;
  std::cout << "Test2:" << std::endl;
  std::cout << "serial   time   = " << serialTime << std::endl;
  std::cout << "parallel time   = " << parallelTime << std::endl;
  if (parallelTime > 0.0000001)
  {
    std::cout << "serial/parallel = " << serialTime / parallelTime << std::endl;
  }
  std::cout << std::endl;
}
 
void Test3()
{
  const unsigned side = 100;
  Matrix a = CreateMatrix(side, side);
  Matrix b = CreateMatrix(side, side);
  Matrix c = CreateMatrix(side, side);
 
  TimeMeasurement timeMeasurement;
 
 
  timeMeasurement.Reset();
 
  for (unsigned i = 0; i < side; ++i)
  {
    for (unsigned j = 0; j < side; ++j)
    {
      const int aa = a[i][j];
      const int bb = b[i][j];
      int cc = 0;
      for (int k = 0; k < 100000; ++k)
      {
        cc += aa * bb;
      }
      c[i][j] = cc;
    }
  }
 
  const double serialTime = timeMeasurement.Elapsed();
 
 
  timeMeasurement.Reset();
 
 
  #pragma omp parallel for
  for (int i = 0; i < side; ++i)
  {
    for (unsigned j = 0; j < side; ++j)
    {
      const int aa = a[i][j];
      const int bb = b[i][j];
      int cc = 0;
      for (int k = 0; k < 100000; ++k)
      {
        cc += aa * bb;
      }
      c[i][j] = cc;
    }
  }
 
  const double parallelTime = timeMeasurement.Elapsed();
 
  std::cout << "###################################" << std::endl;
  std::cout << "Test3:" << std::endl;
  std::cout << "serial   time   = " << serialTime << std::endl;
  std::cout << "parallel time   = " << parallelTime << std::endl;
  if (parallelTime > 0.0000001)
  {
    std::cout << "serial/parallel = " << serialTime / parallelTime << std::endl;
  }
  std::cout << std::endl;
}
 
int main()
{
  std::cout << "Max threads = " << omp_get_max_threads() << std::endl << std::endl;
  Test1();
  Test2();
  Test3();
  return 0;
}
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
15.05.2013, 00:59     распараллеливание
Еще ссылки по теме:

Распараллеливание через omp.h C++
Распараллеливание вычислений C++
Распараллеливание программы с библиотекой TBB C++
C++ Странное распараллеливание
Распараллеливание программы C++

Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
mat_for_c
 Аватар для mat_for_c
120 / 115 / 21
Регистрация: 26.04.2013
Сообщений: 597
Завершенные тесты: 2
15.05.2013, 00:59  [ТС]     распараллеливание #17
Цитата Сообщение от DU Посмотреть сообщение
в релизе совсем другие цифры, т.к. код другой и распараллелилось соответственно по другому
прикольно... в релизе через omp быстрее отработал 1 тест, а остальные остались почти такими же, как без omp.
так это что получается? если делать релизную версию, то там только для малых входных данных распараллеливание хорошо работает?
Yandex
Объявления
15.05.2013, 00:59     распараллеливание
Ответ Создать тему
Опции темы

Текущее время: 03:13. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru