Форум программистов, компьютерный форум, киберфорум
CUDA
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
Другие темы раздела
CUDA Копирование данных CUDA Всем привет! Есть функция: __global__ void encryption(unsigned char* openText, unsigned char* keys, unsigned int length, int t, const int maxThreads, const int index) { long thread = blockIdx.x * maxThreads + threadIdx.x; if (thread < t && index >= 0) { https://www.cyberforum.ru/ cuda/ thread1894454.html CUDA Linux для работы с deep learning и CUDA
Нужен линукс, на котором будет работать caffe и CUDA . Через vmware можно ли поставить линукс, чтоб он смог нормально с драйверами видеокарты работать? p.s. проц - i7 с поддержкой виртуализации
CUDA Программирование с использованием технологии cuda (метод Рунге-Кутта 6 порядка) https://www.cyberforum.ru/ cuda/ thread1888261.html
Помогите пожалуйста с программой. Необходимо переписать программу с использованием технологией cuda. Проблема состоит в том, что я не знаю какой участок когда можно распараллелить без образования гонки данных. #include "stdafx.h" #include <iostream> #include <windows.h> #include <cstdlib> using namespace std; double yravn(double x, double y) {
CUDA CUDA переменные kernel Здравствуйте! Хотелось бы уточнить один момент по поводу переменных в ядре.Допустим,имеется такое ядро: __global__ void kernel(int *var1, double *var2, int *var3) { //var1 - указатель на массив //var2 - указатель на массив //var3 - указатель число int idx = threadIdx.x; https://www.cyberforum.ru/ cuda/ thread1886716.html
CUDA CUDA реализация гост 34.12(Кузнечик)
Всем привет! Пытаюсь реализовать алгоритм шифрования Кузнечик с использованием основе технологии CUDA, столкнулся с проблемой медленного умножения в конечном поле, заменил расчет на таблицы подстановок, скорость все равно оставляет желать лучшего. Может кто подсказать как лучше оптимизировать?
CUDA Нужен проприетарный драйвер или его аналог на видеокарту GEFORCE G105M CUDA 512MB для Kali Linux Всем привет. Нужна помощь в поиске и установке драйвера. Погуглив я понял, установленный по дефолту free noveau драйвер не позволяет системе использовать ресурсы видеокарты на полную. Я использую среду рабочего стола GNOME и бывает, моментами, некоторые графические перемещения виснут, например при прокручивании страницы в окнах - страница ненадолго зависает (но бывает зависнет секунд на 5), еще... https://www.cyberforum.ru/ cuda/ thread1877018.html
CUDA CUDA генератор случайных чисел Доброго времени суток! Подскажите,пожалуйста,как решить проблему.Суть такова.Есть программа,использующая видеокарту для расчётов.Внутри программы есть несколько kernel'ов,внутри одного в том числе нужно получать случайное число.Есть ли какой-нибудь простой аналог функции rand() в CUDA?Если нет,то как мне получить это желанное случайное число внутри __device__ функции?Передавать с __host__ не... https://www.cyberforum.ru/ cuda/ thread1873454.html Установка NVIDIA CUDA CUDA
Здравствуйте! Есть ноутбук Samsung NP530U4C с процессором Intel(R) Core(TM) i3-2377M CPU @ 1.50GHz (4 CPUs). ОЗУ 4 Гб. ОС: Windows 7 (64-разрядная). Видеопроцессор: Intel(R) HD Graphics 3000. Установлены драйвера NVIDIA: NVIDIA Графический драйвер NVIDIA Системное программное обеспечение PhysX.
CUDA Тестирование производительности программы написанной с использованием CUDA Runtime API https://www.cyberforum.ru/ cuda/ thread1824503.html
Уважаемые форумчане. У меня возник один вопрос: имеется программа меняющая местами сектора двух матриц больших размеров около 4 * 10^8, 4 * 10^10 элементов. Для оптимизации выполнения вычислений использовалась технология NVidia CUDA. Мой вопрос заключается в том, что мне бы хотелось получить результаты выполнения программы напр. на GPU Nvidia Geforce GTX 1070 (желательно GTX 1080), которой у...
CUDA CUDA C++ размеры блоков и сеток https://www.cyberforum.ru/ cuda/ thread1806265.html
Здравствуйте! Я поманеньку изучаю С++,в связи с работой возникло желание освоить CUDA для уменьшения времени расчётов.Возник такой вопрос по размерам. Вот у меня написано в MSVC, что максимальный размер блока по иксу составляет 1024 потока,столько же по игреку и 64 по зет.Я так понимаю,что максимальная размерность моего блока составляет 1024*1024*64 потока?Судя по тому,что у меня вылетают...
CUDA CUDA OpenCV C++ фильтр Собеля
Всем привет пишу прогу в C++( CUDA+ openCV) Задание звучало сл образом Напишите программу, в CUDA, в котором будет применять фильтр Собеля, рассчитанный с помощью графического процессора #include <opencv2/core/core.hpp> #include <opencv2/highgui/highgui.hpp> #include <opencv2/imgproc/imgproc.hpp> #include "cuda_runtime.h" #include "device_launch_parameters.h"
CUDA Helloworld with CUDA. cudaMemcpy https://www.cyberforum.ru/ cuda/ thread1760715.html
Даже не знаю, куда писать :), поскольку вопрос не совсем по си. Пытаюсь освоить nvcc. #include "stdio.h" int main( void ) { int a, b; // host копии a, b int *dev_a; int size = sizeof( int );
6045 / 2160 / 753
Регистрация: 10.12.2010
Сообщений: 6,005
Записей в блоге: 3
09.01.2017, 14:01 0

Ускорение доступа к элементам массива CUDA - CUDA - Ответ 9984660

09.01.2017, 14:01. Показов 1370. Ответов 6
Метки (Все метки)

Ответ

Имелось ввиду нечто подобное, если конечно архитектура приложения позволяет малой кровью:
Код
{
  // at some place where all threadId's are known.

  for each threadId do
    thread <- blockIdx.x * maxThreads + threadIdx.x;
    sharedOpenTextArray[thread] <- openText[thread];
    arrayOfL[thread] <- calcL(sharedOpenTextArray[thread]); // calculate 'l' like in R function
  end for // now all is pre-calculated

  // threads are being spawned here and code executed

  encryption(...)
  {
    // ...
    _syncthreads();

    LSX(arrayOfL[thread], 0, sharedCipherText); // we don't calculate 'l' here in 'R' anymore

    _syncthreads();
    // ...
  }
}


Вернуться к обсуждению:
Ускорение доступа к элементам массива CUDA CUDA
0
Заказать работу у эксперта
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
09.01.2017, 14:01
Готовые ответы и решения:

Скорость доступа к элементам массива различными способами
Народ, кто-нить исследовал тему, наиболее скоростного доступа к массивам и операции с элеменами и...

Небольшая прога по методам доступа к элементам массива
Смысл такой, имеется трехмерный массив A. Данные считываются с файла(тут все верно). Хотелось бы...

Использование указателей для доступа к элементам массива
Помогите пожалуйста написать программу с подробным обьяснением:. Использование указателей для...

Напишите цикл for для доступа к элементам массива в обратном порядке
Правильно ли? #include &lt;iostream&gt; using namespace std; int main() { int size; cout...

6
09.01.2017, 14:01
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
09.01.2017, 14:01
Помогаю со студенческими работами здесь

Записать синтаксис объявления и определения свойства класса для доступа к элементам двухмерного массива данны
Записать синтаксис объявления и определения свойства класса для доступа к элементам двухмерного...

Скорость, касательное ускорение, полное ускорение, нормальное ускорение и радиус кривизны траектории
Движение точки задано координатным способом. Найти траекторию и начертить ее. Кроме того определить...

Ограничение доступа к элементам UI
Здравствуйте уважаемые android разработчики. Будьте так добры помочь ламеру в доработки приложения....

Время доступа к элементам
Подскажите, как определить время доступа к эл-там массива двумерного и одномерного. Задача:...

0
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru