Форум программистов, компьютерный форум CyberForum.ru

Разбор программы - C++

Восстановить пароль Регистрация
Другие темы раздела
C++ Как учить с++ чтобы не бросить (учить типы влом) http://www.cyberforum.ru/cpp-beginners/thread644642.html
Суть не в том токо как учить, а в том как начать, чтобы не бросить..Учить типы влом..Хотелось бы норм учебник по с++, норм компилятор который распространён и о котором хорошие отзывы...Норм учебник - подразумеваю на примерах..т.е. например сёня напишем чат и т.д. и т.п..Мне очень интересно именно такое)Может кто нить что нить мб подскажет мб?
C++ подключаемые файлы Я использую много файлов (.h) в программе... В уже готовом exe файле они будут включены??? или мне придеться все эти хедеры с собой таскать???? http://www.cyberforum.ru/cpp-beginners/thread644619.html
C++ Компьютер не хочет подавать признаки жизни
Всё пытаются использовать esc-последовательность \a, которая должна выдавать звук. Делаю так: cout << "sound: \a"; Звуков не слышу. Это, что устаревший символ или я, неправильно его использую?
Структура: Система учета за отопление многоквартирного дома C++
Здарствуйте, помогите с задачей пожалуйста. Система учета за отопление многоквартирного дома Таблица ФИО Квартира площадь Тариф 1. 2. 3. 4. 5.
C++ Перезапись строки и Bad_alloc http://www.cyberforum.ru/cpp-beginners/thread644536.html
BOOL ROOM::AddHistory(const char* newHistory) { BOOL newHistorySize = strlen(newHistory)+1; char* shiftHistory; if (_r_historySize+newHistorySize >= ROOM_HISTORY_SIZE) { shiftHistory = new char; int erasableHistorySize = 0, shiftPos = 0; do {
C++ Функция редактирования строк Доброго времени суток. Столкнулся со следующей проблемой: void Erase(char **str, int pos, int n) { char *newstr1, *newstr2; newstr2 = *str; int i = 0, len; len = strlen(newstr2); if (len >= pos + n) { newstr1 = new char; подробнее

Показать сообщение отдельно
Danzel
6 / 6 / 3
Регистрация: 21.08.2012
Сообщений: 45
30.08.2012, 21:20     Разбор программы
После недели освоения cuda и разбора программ,наткнулся на урок по куда,прилагается программа перемножения матриц,собственно код:

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
// Perform "naive" square matrix multiplication
//
#include <stdio.h>
 
#define BLOCK_SIZE  16          // submatrix size
#define N           1024        // matrix size is N*N
 
 
// KERNEL //
__global__ void matMult ( float * a, float * b, int n, float * c ){
  int   bx  = blockIdx.x;       // block index
  int   by  = blockIdx.y;
  int   tx  = threadIdx.x;      // thread index
  int   ty  = threadIdx.y;
  float sum = 0.0f;         // подэлемент
  int     ia  = n * BLOCK_SIZE * by + n * ty;   // a [i][0]
  int   ib  = BLOCK_SIZE * bx + tx;
    
  // умножение матриц
  for ( int k = 0; k < n; k++ )
    sum += a [ia + k] * b [ib + k*n];
            
  // блок глобальной памяти для матрицы
  // каждый поток в один элемент
  int ic = n * BLOCK_SIZE * by + BLOCK_SIZE * bx;
    
  c [ic + n * ty + tx] = sum;
}
 
 
// HOST CODE //
int main ( int argc, char *  argv [] ){
  int   numBytes = N * N * sizeof ( float );
  
  // выделение памяти хоста
  float * a = new float [N*N];
  float * b = new float [N*N];
  float * c = new float [N*N];
 
  for ( int i = 0; i < N; i++ )
    for ( int j = 0; j < N; j++ ){
      a [i] = 0.0f;
      b [i] = 1.0f;
    }
        
  // выделение памяти устройства
  float * adev = NULL;
  float * bdev = NULL;
  float * cdev = NULL;
    
  cudaMalloc ( (void**)&adev, numBytes );
  cudaMalloc ( (void**)&bdev, numBytes );
  cudaMalloc ( (void**)&cdev, numBytes );
 
  // конфигурация запуска ядра
  dim3 threads ( BLOCK_SIZE, BLOCK_SIZE );
  dim3 blocks  ( N / threads.x, N / threads.y);
 
  // создание куда таймера
  cudaEvent_t start, stop;
  float gpuTime = 0.0f;
 
  cudaEventCreate ( &start );
  cudaEventCreate ( &stop );
    
  // asynchronously issue work to the GPU (all to stream 0)
  cudaEventRecord ( start, 0 );
  cudaMemcpy      ( adev, a, numBytes, cudaMemcpyHostToDevice );
  cudaMemcpy      ( bdev, b, numBytes, cudaMemcpyHostToDevice );
  
  matMult<<<blocks, threads>>> ( adev, bdev, N, cdev );
    
  cudaMemcpy      ( c, cdev, numBytes, cudaMemcpyDeviceToHost );
  cudaEventRecord ( stop, 0 );
 
  cudaEventSynchronize ( stop );
  cudaEventElapsedTime ( &gpuTime, start, stop );
 
  
  
 
  // время работы
  printf("time spent executing by the GPU: %.2f millseconds\n", gpuTime );
 
  // освобождение ресурсов
  cudaEventDestroy ( start );
  cudaEventDestroy ( stop  );
  cudaFree         ( adev  );
  cudaFree         ( bdev  );
  cudaFree         ( cdev  );
 
  delete a;
  delete b;
  delete c;
  system("pause");
 
  return 0;
}

Возникли два вопроса:
1)Как заполняется матрица?
2)Как вывести на экран эту матрицу?(Пробовал вывести с и sum выдает ошибку,с остальной частью вроде все понятно)
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
 
Текущее время: 18:37. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2016, vBulletin Solutions, Inc.
Рейтинг@Mail.ru