|
|
Другие темы раздела | |
CUDA Копирование данных CUDA Всем привет! Есть функция: __global__ void encryption(unsigned char* openText, unsigned char* keys, unsigned int length, int t, const int maxThreads, const int index) { long thread = blockIdx.x * maxThreads + threadIdx.x; if (thread < t && index >= 0) { https://www.cyberforum.ru/ cuda/ thread1894454.html |
CUDA Linux для работы с deep learning и CUDA Нужен линукс, на котором будет работать caffe и CUDA . Через vmware можно ли поставить линукс, чтоб он смог нормально с драйверами видеокарты работать? p.s. проц - i7 с поддержкой виртуализации |
CUDA Программирование с использованием технологии cuda (метод Рунге-Кутта 6 порядка)
https://www.cyberforum.ru/ cuda/ thread1888261.html Помогите пожалуйста с программой. Необходимо переписать программу с использованием технологией cuda. Проблема состоит в том, что я не знаю какой участок когда можно распараллелить без образования гонки данных. #include "stdafx.h" #include <iostream> #include <windows.h> #include <cstdlib> using namespace std; double yravn(double x, double y) { |
CUDA CUDA переменные kernel Здравствуйте! Хотелось бы уточнить один момент по поводу переменных в ядре.Допустим,имеется такое ядро: __global__ void kernel(int *var1, double *var2, int *var3) { //var1 - указатель на массив //var2 - указатель на массив //var3 - указатель число int idx = threadIdx.x; https://www.cyberforum.ru/ cuda/ thread1886716.html |
CUDA CUDA реализация гост 34.12(Кузнечик) Всем привет! Пытаюсь реализовать алгоритм шифрования Кузнечик с использованием основе технологии CUDA, столкнулся с проблемой медленного умножения в конечном поле, заменил расчет на таблицы подстановок, скорость все равно оставляет желать лучшего. Может кто подсказать как лучше оптимизировать? |
CUDA Нужен проприетарный драйвер или его аналог на видеокарту GEFORCE G105M CUDA 512MB для Kali Linux Всем привет. Нужна помощь в поиске и установке драйвера. Погуглив я понял, установленный по дефолту free noveau драйвер не позволяет системе использовать ресурсы видеокарты на полную. Я использую среду рабочего стола GNOME и бывает, моментами, некоторые графические перемещения виснут, например при прокручивании страницы в окнах - страница ненадолго зависает (но бывает зависнет секунд на 5), еще... https://www.cyberforum.ru/ cuda/ thread1877018.html |
CUDA CUDA генератор случайных чисел Доброго времени суток! Подскажите,пожалуйста,как решить проблему.Суть такова.Есть программа,использующая видеокарту для расчётов.Внутри программы есть несколько kernel'ов,внутри одного в том числе нужно получать случайное число.Есть ли какой-нибудь простой аналог функции rand() в CUDA?Если нет,то как мне получить это желанное случайное число внутри __device__ функции?Передавать с __host__ не... https://www.cyberforum.ru/ cuda/ thread1873454.html |
Установка NVIDIA CUDA CUDA Здравствуйте! Есть ноутбук Samsung NP530U4C с процессором Intel(R) Core(TM) i3-2377M CPU @ 1.50GHz (4 CPUs). ОЗУ 4 Гб. ОС: Windows 7 (64-разрядная). Видеопроцессор: Intel(R) HD Graphics 3000. Установлены драйвера NVIDIA: NVIDIA Графический драйвер NVIDIA Системное программное обеспечение PhysX. |
CUDA Тестирование производительности программы написанной с использованием CUDA Runtime API
https://www.cyberforum.ru/ cuda/ thread1824503.html Уважаемые форумчане. У меня возник один вопрос: имеется программа меняющая местами сектора двух матриц больших размеров около 4 * 10^8, 4 * 10^10 элементов. Для оптимизации выполнения вычислений использовалась технология NVidia CUDA. Мой вопрос заключается в том, что мне бы хотелось получить результаты выполнения программы напр. на GPU Nvidia Geforce GTX 1070 (желательно GTX 1080), которой у... |
CUDA CUDA C++ размеры блоков и сеток
https://www.cyberforum.ru/ cuda/ thread1806265.html Здравствуйте! Я поманеньку изучаю С++,в связи с работой возникло желание освоить CUDA для уменьшения времени расчётов.Возник такой вопрос по размерам. Вот у меня написано в MSVC, что максимальный размер блока по иксу составляет 1024 потока,столько же по игреку и 64 по зет.Я так понимаю,что максимальная размерность моего блока составляет 1024*1024*64 потока?Судя по тому,что у меня вылетают... |
CUDA CUDA OpenCV C++ фильтр Собеля Всем привет пишу прогу в C++( CUDA+ openCV) Задание звучало сл образом Напишите программу, в CUDA, в котором будет применять фильтр Собеля, рассчитанный с помощью графического процессора #include <opencv2/core/core.hpp> #include <opencv2/highgui/highgui.hpp> #include <opencv2/imgproc/imgproc.hpp> #include "cuda_runtime.h" #include "device_launch_parameters.h" |
CUDA Helloworld with CUDA. cudaMemcpy
https://www.cyberforum.ru/ cuda/ thread1760715.html Даже не знаю, куда писать :), поскольку вопрос не совсем по си. Пытаюсь освоить nvcc. #include "stdio.h" int main( void ) { int a, b; // host копии a, b int *dev_a; int size = sizeof( int ); |
09.01.2017, 14:01 | 0 |
Ускорение доступа к элементам массива CUDA - CUDA - Ответ 998466009.01.2017, 14:01. Показов 1370. Ответов 6
Метки (Все метки)
Ответ
Имелось ввиду нечто подобное, если конечно архитектура приложения позволяет малой кровью:
Код
{ // at some place where all threadId's are known. for each threadId do thread <- blockIdx.x * maxThreads + threadIdx.x; sharedOpenTextArray[thread] <- openText[thread]; arrayOfL[thread] <- calcL(sharedOpenTextArray[thread]); // calculate 'l' like in R function end for // now all is pre-calculated // threads are being spawned here and code executed encryption(...) { // ... _syncthreads(); LSX(arrayOfL[thread], 0, sharedCipherText); // we don't calculate 'l' here in 'R' anymore _syncthreads(); // ... } } Вернуться к обсуждению: Ускорение доступа к элементам массива CUDA CUDA
0
|
09.01.2017, 14:01 | |
Готовые ответы и решения:
6
Скорость доступа к элементам массива различными способами Небольшая прога по методам доступа к элементам массива Использование указателей для доступа к элементам массива Напишите цикл for для доступа к элементам массива в обратном порядке |
09.01.2017, 14:01 | |
09.01.2017, 14:01 | |
Помогаю со студенческими работами здесь
0
Записать синтаксис объявления и определения свойства класса для доступа к элементам двухмерного массива данны Скорость, касательное ускорение, полное ускорение, нормальное ускорение и радиус кривизны траектории Ограничение доступа к элементам UI Время доступа к элементам |