6 / 6 / 5
Регистрация: 21.08.2012
Сообщений: 45

Разбор программы

30.08.2012, 21:20. Показов 2264. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
После недели освоения cuda и разбора программ,наткнулся на урок по куда,прилагается программа перемножения матриц,собственно код:

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
// Perform "naive" square matrix multiplication
//
#include <stdio.h>
 
#define BLOCK_SIZE  16          // submatrix size
#define N           1024        // matrix size is N*N
 
 
// KERNEL //
__global__ void matMult ( float * a, float * b, int n, float * c ){
  int   bx  = blockIdx.x;       // block index
  int   by  = blockIdx.y;
  int   tx  = threadIdx.x;      // thread index
  int   ty  = threadIdx.y;
  float sum = 0.0f;         // подэлемент
  int     ia  = n * BLOCK_SIZE * by + n * ty;   // a [i][0]
  int   ib  = BLOCK_SIZE * bx + tx;
    
  // умножение матриц
  for ( int k = 0; k < n; k++ )
    sum += a [ia + k] * b [ib + k*n];
            
  // блок глобальной памяти для матрицы
  // каждый поток в один элемент
  int ic = n * BLOCK_SIZE * by + BLOCK_SIZE * bx;
    
  c [ic + n * ty + tx] = sum;
}
 
 
// HOST CODE //
int main ( int argc, char *  argv [] ){
  int   numBytes = N * N * sizeof ( float );
  
  // выделение памяти хоста
  float * a = new float [N*N];
  float * b = new float [N*N];
  float * c = new float [N*N];
 
  for ( int i = 0; i < N; i++ )
    for ( int j = 0; j < N; j++ ){
      a [i] = 0.0f;
      b [i] = 1.0f;
    }
        
  // выделение памяти устройства
  float * adev = NULL;
  float * bdev = NULL;
  float * cdev = NULL;
    
  cudaMalloc ( (void**)&adev, numBytes );
  cudaMalloc ( (void**)&bdev, numBytes );
  cudaMalloc ( (void**)&cdev, numBytes );
 
  // конфигурация запуска ядра
  dim3 threads ( BLOCK_SIZE, BLOCK_SIZE );
  dim3 blocks  ( N / threads.x, N / threads.y);
 
  // создание куда таймера
  cudaEvent_t start, stop;
  float gpuTime = 0.0f;
 
  cudaEventCreate ( &start );
  cudaEventCreate ( &stop );
    
  // asynchronously issue work to the GPU (all to stream 0)
  cudaEventRecord ( start, 0 );
  cudaMemcpy      ( adev, a, numBytes, cudaMemcpyHostToDevice );
  cudaMemcpy      ( bdev, b, numBytes, cudaMemcpyHostToDevice );
  
  matMult<<<blocks, threads>>> ( adev, bdev, N, cdev );
    
  cudaMemcpy      ( c, cdev, numBytes, cudaMemcpyDeviceToHost );
  cudaEventRecord ( stop, 0 );
 
  cudaEventSynchronize ( stop );
  cudaEventElapsedTime ( &gpuTime, start, stop );
 
  
  
 
  // время работы
  printf("time spent executing by the GPU: %.2f millseconds\n", gpuTime );
 
  // освобождение ресурсов
  cudaEventDestroy ( start );
  cudaEventDestroy ( stop  );
  cudaFree         ( adev  );
  cudaFree         ( bdev  );
  cudaFree         ( cdev  );
 
  delete a;
  delete b;
  delete c;
  system("pause");
 
  return 0;
}

Возникли два вопроса:
1)Как заполняется матрица?
2)Как вывести на экран эту матрицу?(Пробовал вывести с и sum выдает ошибку,с остальной частью вроде все понятно)
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
30.08.2012, 21:20
Ответы с готовыми решениями:

разбор программы
друзья хотел бы попросить помощи с одной программой, в программировании не разбираюсь по єтому пришел к вам на форум. Есть программа одно...

разбор программы
Друг написал прогу, но комментарии к ней не сделал, поэтому не понятно. Помогите разобраться с программой. Вот условие: Создать класс...

Разбор программы
#include&lt;iostream&gt; using namespace std; void func1(); void func2(); int f; int main() {

1
24 / 3 / 0
Регистрация: 28.10.2012
Сообщений: 35
02.11.2012, 23:34
Danzel, еще актуально, или уже решил вопрос?
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
02.11.2012, 23:34
Помогаю со студенческими работами здесь

Разбор алгоритма программы
Здравствуйте, у меня есть программа, вычисляющая факториал заданного числа. #include &quot;stdafx.h&quot; #include...

Разбор алгоритма программы
Здравствуйте, у меня есть программа, вычисляющая факториал заданного числа. #include &quot;stdafx.h&quot; #include...

Разбор кода программы
сделали контрольную и защитить не не могу. помогите разобрать что значит код, пожалуйста. реализация LZ метода сжатия кто может...

Разбор кода программы
Здравствуйте! Помогите пожалуйста написать программу (на Bison+Flex), которая будет сканировать текстовый документ и выводить информацию об...

Разбор программы(сортировка)
Как объяснить принцип работы (выделенного) кода. Не могу до конца разобрать какие действия проводит данная программа поэтапно. ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Опции темы

Новые блоги и статьи
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Первый деплой
lagorue 16.01.2026
Не спеша развернул своё 1ое приложение в kubernetes. А дальше мне интересно создать 1фронтэнд приложения и 2 бэкэнд приложения развернуть 2 деплоя в кубере получится 2 сервиса и что-бы они. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит: токи, напряжения и их 1 и 2 производные при t = 0;. . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Изучаю kubernetes
lagorue 13.01.2026
А пригодятся-ли мне знания kubernetes в России?
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru