Форум программистов, компьютерный форум CyberForum.ru
Наши страницы

С++ для начинающих

Войти
Регистрация
Восстановить пароль
 
AndrSlav
44 / 44 / 6
Регистрация: 20.12.2013
Сообщений: 259
#1

Многопоточность и решение СЛУ - C++

19.04.2014, 14:15. Просмотров 180. Ответов 0
Метки нет (Все метки)

Здравствуйте, решаю разреженную СЛУ методом последовательных приближений. Подскажите, пожалуйста, как можно увеличить скорость решения? В частности, будет ли быстрее, если использовать более современные методы создания потоков (классы Thread или др.)?
p.s. СЛУ решается, но медленно, буду рад любым советам.

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
//Функция, запускающая потоки
//rP- правая часть СЛУ
// rezult - результат
//relax- коэф-нт релаксации
//accuracy- точность
//nThreads- кол-во потоков
//nX, nY, nZ - задают размерность матрицы
 
bool MATRIX_Lenta::solveSparceMatrixUMulti(double2* rP, double2* rezult, double2 relax, double2 accuracy, int nThreads, size_t nX, size_t nY, size_t nZ)
{
 VEC rez(num,rezult);
 VEC rez2(num,rezult);
 
 InitializeCriticalSection(&crSect1);
 InitializeCriticalSection(&crSect2);
 InitializeCriticalSection(&crSect3);
 InitializeCriticalSection(&crSect4);
 
 for(size_t i=0;i<num;++i) rightPart[i]= rP[i];    //Копируем правую часть
 size_t iCount;
 size_t n1= nY*nZ, n2= nX*nY*nZ- nY*nZ- 1;   //Индексы первой и последней расчетных ячеек
 
///////////////////////////////////////////////////
 
    PMYDATA_LENTA* pDataArray= new PMYDATA_LENTA[nThreads];
    DWORD* dwThreadIdArray= new DWORD[nThreads];
    HANDLE* hThreadArray= new HANDLE[nThreads];
    HANDLE* hEventArray= new HANDLE[nThreads];
    HANDLE* hEventArray2= new HANDLE[nThreads];
 
        for( int i=0; i<nThreads; i++ )
        {
         hEventArray[i]= CreateEvent(NULL, TRUE, FALSE, NULL);  //
         hEventArray2[i]= CreateEvent(NULL, TRUE, FALSE, NULL);  //
        };
        for( int i=0; i<nThreads; i++ )
        {
         pDataArray[i]= new MYDATA_LENTA;
         pDataArray[i]->rez= &rez;
         pDataArray[i]->rez2= &rez2;
         pDataArray[i]->relax= relax;
         pDataArray[i]->n1= size_t((n2- n1+ 1)/nThreads*i+ n1);
           if(i!=(nThreads-1)) pDataArray[i]->n2= size_t((n2- n1+ 1)/nThreads*(i+1)+ n1- 1);
           else pDataArray[i]->n2= n2;
         pDataArray[i]->nP= nThreads;
         pDataArray[i]->iP= i;
         pDataArray[i]->nX= nX;
         pDataArray[i]->nY= nY;
         pDataArray[i]->nZ= nZ;
         pDataArray[i]->accuracy= accuracy;
         pDataArray[i]->hThreadArray= hThreadArray;
         pDataArray[i]->rightPart= rightPart;
         pDataArray[i]->masM= masM;
         pDataArray[i]->hEventArray= hEventArray;
         pDataArray[i]->hEventArray2= hEventArray2;
 
            hThreadArray[i] = CreateThread(
            NULL,                   // default security attributes
            0,                      // use default stack size
            subFunction_Lenta,      // thread function name
            pDataArray[i],          // argument to thread function
            0, //CREATE_SUSPENDED,  // use default creation flags
            &dwThreadIdArray[i]);   // returns the thread identifier
        };
 
 WaitForMultipleObjects(nThreads, hThreadArray, TRUE, INFINITE);
 DeleteCriticalSection(&crSect1);
 DeleteCriticalSection(&crSect2);
 DeleteCriticalSection(&crSect3);
 DeleteCriticalSection(&crSect4);
 rez= rez2;
 
 for(size_t i=0; i<num; ++i) rezult[i]= rez2[i];
 
 for(int i=0; i<nThreads; i++) delete pDataArray[i];
 delete[] pDataArray; pDataArray=0;
 delete[] dwThreadIdArray; dwThreadIdArray=0;
 
 for(int i=0; i<nThreads; i++)
 {
  CloseHandle(hEventArray[i]);
  CloseHandle(hEventArray2[i]);
  CloseHandle(hThreadArray[i]);
 };
 delete[] hThreadArray; hThreadArray=0;
 delete[] hEventArray; hEventArray=0;
 delete[] hEventArray2; hEventArray2=0;
 
 return true;
};
 
 
 
DWORD WINAPI subFunction_Lenta(LPVOID lpParam)
{
 MYDATA_LENTA* pDataArray= (MYDATA_LENTA*)lpParam;
 static long tmp=0;
 static long t=0;
 static long t2=0;
 static long flag=0;       //При true выброс из всех циклов
 static long s=0;
 static long s2=0;
 VEC* rez= pDataArray->rez;
 VEC* rez2= pDataArray->rez2;
 double2 relax= pDataArray->relax;
 double2* rr1= &((*(pDataArray->rez))[0]);
 double2* rr2= &((*(pDataArray->rez2))[0]);
 size_t n1= pDataArray->n1;
 size_t n2= pDataArray->n2;
 int nP= pDataArray->nP;  //Количество процессов
 int iP= pDataArray->iP;  //Текущий процесс
 size_t nX= pDataArray->nX;
 size_t nY= pDataArray->nY;
 size_t nZ= pDataArray->nZ;
 size_t nTot= nX*nY*nZ;
 double2 accuracy= pDataArray->accuracy;  //Точность
 HANDLE* hThreadArray= pDataArray->hThreadArray;
 HANDLE* hEventArray= pDataArray->hEventArray;
 HANDLE* hEventArray2= pDataArray->hEventArray2;
 double2* rightPart= pDataArray->rightPart;
 double2* masM= pDataArray->masM;
 
 //static int* masF= 0;
 double2* p= 0,* p1= &(rr2[n1]),* pL= &(rr2[n2]);
 double2* pR= 0,* pR1= &(rightPart[n1]);
 
 double2 *k1, *k2, *k3, *k4, *k5, *k6;
 double2 *v1, *v2, *v3 ,*v4 ,*v5, *v6;
 
 double2 relax_= 1.-relax;
 static size_t haha=0;
 static size_t FOut=0;
 
 //
 size_t fL= 0;
 double2 errOld, errNew;
 static size_t fL2= 0;
 double2 acc;
 
    while(1)
    {
     p= p1; pR= pR1;
     v1= &(rr1[n1- nY*nZ]); v2= &(rr1[n1+ nY*nZ]);    //Значения на предыдущем шаге расчета
     v3= &(rr1[n1- nZ]); v4= &(rr1[n1+ nZ]);
     v5= &(rr1[n1- 1]); v6= &(rr1[n1+ 1]);
     k1= &(masM[n1+ nTot]); k2= &(masM[n1+ 2*nTot]);     //Коэффициенты для недиагональных элементов матрицы
     k3= &(masM[n1+ 3*nTot]); k4= &(masM[n1+ 4*nTot]);
     k5= &(masM[n1+ 5*nTot]); k6= &(masM[n1+ 6*nTot]);
     EnterCriticalSection(&crSect1);
     if(fL2!=nP) fL2=0;
     ++FOut;
     ++haha;
     if(flag)
     {
      if(tmp==1) flag= t= t2= fL2= 0;
      --tmp;
      LeaveCriticalSection(&crSect1);
      break;
     };
     LeaveCriticalSection(&crSect1);
 
     for(; p<= pL; ++p, ++pR, ++v1, ++v2, ++v3, ++v4, ++v5, ++v6, ++k1, ++k2, ++k3, ++k4, ++k5, ++k6)     //Прогонка по части СЛУ
     {
      (*p)=relax*(*pR)+ relax_*(*p);
      (*p)-=((*v1)*(*k1)+ (*v2)*(*k2)+ (*v3)*(*k3)+ (*v4)*(*k4)+ (*v5)*(*k5)+ (*v6)*(*k6))*relax;
     };
     EnterCriticalSection(&crSect3);
     ++s2;
     if(s2==nP){s= t2= 0; for(int i=0; i<nP; ++i) ResetEvent(hEventArray2[i]);};
     LeaveCriticalSection(&crSect3);
     SetEvent(hEventArray[iP]);
     WaitForMultipleObjects(nP, hEventArray, TRUE, INFINITE);
     EnterCriticalSection(&crSect4);
     ++s;
 
     if(s==nP){t=0; for(int i=0; i<nP; ++i) ResetEvent(hEventArray[i]);};
     LeaveCriticalSection(&crSect4);
 
     EnterCriticalSection(&crSect2);
     if(!t2) {s2= 0; t2=1; if(FOut>=nP*100){FOut=0; acc= ((*rez)-=(*rez2)).errore(accuracy, errNew); if(!flag && (acc || (fL && (errOld<=errNew || fabs(errOld- errNew)<=epsSq)))){flag=1; tmp= nP;};
                                                                                                                                                                                                                                                                                                errOld= errNew; fL=1;}; (*rez)=(*rez2);};
     LeaveCriticalSection(&crSect2);
     SetEvent(hEventArray2[iP]);
     WaitForMultipleObjects(nP, hEventArray2, TRUE, INFINITE);
    }; //while
 
 return 0;
};
0
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
19.04.2014, 14:15
Здравствуйте! Я подобрал для вас темы с ответами на вопрос Многопоточность и решение СЛУ (C++):

Решение СЛУ методом Гаусса - C++
Напишите плз прогу, которая будет решать слу методом Гаусса. #include &quot;stdafx.h&quot; #include &quot;iostream&quot; #include &quot;conio.h&quot; using...

Решение СЛУ методом Жордана-Гаусса, заменить массив на динамический - C++
#include &lt;iostream&gt; #include &lt;iomanip&gt; #include &lt;stdlib.h&gt; using namespace std; class Jordan{ private: int NEQ, N1;...

СЛУ методом LDLT разложения Холецкого - C++
Решить СЛУ методом LDLT разложения Холецкого. помогите пожалуйста разработать данный алгоритм.

Многопоточность - C++
Всем привет, заметил в одном проекте подобный код: struct Counter { int i; } #define g_counter ACE_Singleton&lt; Counter,...

Многопоточность - C++
Не особо понимаю мнопоточность в с++. Есть задание типа.... Сделать программу, иммитирующую работу одновременно двух конечных автоматов....

Многопоточность - C++
Есть задание: Написать и протестировать функцию, которая находит в массиве минимальный по модулю элемент и заменяет им все элементы с...

Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
19.04.2014, 14:15
Привет! Вот еще темы с ответами:

C++ и Многопоточность. - C++
Всем привет. Написал код с использованием Curl для авторизации в вконтакте (могу скинуть код). Аккаунты для авторизации берутся из...

Многопоточность - C++
Здравствуйте уважаемые форумчане! Суть проблемы такова, в нижней задаче есть две методы сортировки, и эти два метода надо чтобы выполнялись...

Многопоточность в C++ и C++11 - C++
как я понял, многопоточность появилась в С++11 cтандарте. Почитал что его вроде как visual studio не поддерживает(?) есть компилятор gcc,...

Многопоточность в С++ - C++
Добрый день! Если я создам экземпляр класса в одном потоке и начну одновременно из нескольких других потоков обращаться тому...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru