Форум программистов, компьютерный форум, киберфорум
CUDA
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/5: Рейтинг темы: голосов - 5, средняя оценка - 5.00
0 / 0 / 0
Регистрация: 06.09.2020
Сообщений: 60

Сумма элементов массива

27.11.2023, 16:48. Показов 1281. Ответов 1

Студворк — интернет-сервис помощи студентам
Здравствуйте подскажите пожалуйста в чем проблема
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
#define N 10
__global__ void reduce(int *g_idata, int *g_odata) {
    extern __shared__ int sdata[];
    
    unsigned int tid = threadIdx.x;
    unsigned int i = blockIdx.x*blockDim.x + threadIdx.x;
    sdata[tid] = g_idata[i];
    __syncthreads();
    
    for(unsigned int s=1; s < blockDim.x; s *= 2) {
    if (tid % (2*s) == 0) {
    sdata[tid] += sdata[tid + s];
    }
    __syncthreads();
    }
    
    if (tid == 0) g_odata[blockIdx.x] = sdata[0];
}
 
int main(){
    int host_a[N], host_b[N];
    int *dev_a, *dev_b;
    int size = sizeof( int );
     
    for(int i = 0; i < N; i++){
        host_a[i] = 1;
    }
    
    cudaMalloc( (void**)&dev_a, size );
    cudaMalloc( (void**)&dev_b, size );
    
    cudaMemcpy(dev_a, host_a, N * size, cudaMemcpyHostToDevice);
     
    reduce<<< 1, N >>>(dev_a, dev_b);
    
    cudaMemcpy( host_b, dev_b, N*size, cudaMemcpyHostToDevice ); 
    
    for(int i =0; i < N; i++)
        cout << host_b[i] << " ";
    
    
    return 0;
}
Нужно суммировать все элементы массива, но выводит -1910005256 32765 6889472 0 1 0 4210405 0 1 0, когда исходный массив это 10 единиц
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
27.11.2023, 16:48
Ответы с готовыми решениями:

Вычислить z=(s1+s2) /2 где s1 - сумма положительных элементов массива x( n) s2- сумма отрицательных элементов массива
Вычислить z=(s1+s2) /2 где s1 - сумма положительных элементов массива x( n) s2- сумма отрицательных элементов массива y(m) Для...

Z=(s1+s2)/2 , где s1 - сумма положительных элементов массива x(50) ; s2 - сумма отрицательных элементов массива Y(60)
Составить функцию. Вычислить: Z=(s1+s2)/2 , где s1 - сумма положительных элементов массива x(50) ; s2 - сумма отрицательных...

для массивов А и В определить y[i] = a[i]^2 / (сумма элементов массива В) и k[i] = b[i] / (сумма элементов массива А)
всем мир помогите с задачкой братишки

1
Asm/C++/Delphi/Py/PHP/VBA
 Аватар для Jin X
6808 / 2048 / 238
Регистрация: 14.12.2014
Сообщений: 4,297
Записей в блоге: 12
03.12.2023, 14:12
Во-первых, в cudaMalloc нужно указать размер не одного элемента, а всего массива (N * size).
Во-вторых, во втором cudaMemcpy (после reduce) нужно указать cudaMemcpyDeviceToHost, вы же хотите скопировать с девайса на хост.
В-третьих, после reduce нужно вызвать cudaDeviceSynchronize();, чтобы дождаться завершения работы кернеля.
Ну и в-четвёртых, вопрос к алгоритму: свёртка (reduce) возвращает 1 элемент, поэтому вам массив не нужен. И зачем тут extern, указывайте sdata[N]?
То есть (по последнему пункту) вам достаточно int host_b + cudaMemcpy(&host_b, dev_b, size, cudaMemcpyDeviceToHost) + if (tid == 0) *g_odata = sdata[0].

Добавлено через 1 минуту
Если считать глобально, в несколько блоков, то вам нужен массив host_b размером с кол-во блоков, чтобы писать результаты в g_odata[blockIdx.x], а затем уже на хосте складывать результаты.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
03.12.2023, 14:12
Помогаю со студенческими работами здесь

Вычислить z=s1+s2/2, где s1-сумма положительных элементов массива X(8); s2-сумма отрицательных элементов масси
Вычислить z=s1+s2/2, где s1-сумма положительных элементов массива X(8); s2-сумма отрицательных элементов массива Y(10) . обе суммы...

s1 и k1- сумма и количество положительных элементов массива x; s2 и k2- сумма и количество отрицательных элементов массива y. вычислить формулу
вычислить Z=(exp(s1)+exp(s2))/(k1*k2), где s1 и k1- сумма и количество положительных элементов массива x=100; s2 и k2- сумма и количество...

Найти R=(Х+Y)/Z,где Х-сумма всех элементов массива А(14), Y-сумма всех элементов массива В(9),Z-сумма всех элементов массива С(11)
Заданы три массива:А(5),В(8) и С(12). Найти R=(Х+Y)/Z,где Х-сумма всех элементов массива А(14), Y-сумма всех элементов массива В(9),Z-сумма...

Произведение положительных элементов массива, сумма элементов массива, удаление четных элементов
в одномерном массиве состоящим из n элементов вычислить: произведение положительных элементов массива; сумму элементов массива,...

Переставить элементы одномерного массива так,чтобы сумма элементов первой половины массива была равна сумме элементов второй половины массива
Помогите пожалуйста решить задачу Переставить элементы одномерного массива так,чтобы сумма элементов первой половины массива была равна...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru