Форум программистов, компьютерный форум CyberForum.ru
Наши страницы

CUDA

Войти
Регистрация
Восстановить пароль
 
Colt_11
6 / 6 / 1
Регистрация: 18.01.2016
Сообщений: 61
#1

Ускорение доступа к элементам массива CUDA - CUDA

06.01.2017, 20:13. Просмотров 454. Ответов 6
Метки нет (Все метки)

Всем привет!
Есть функция осуществляющая умножение и сложение в конечном поле. Умножения осуществляется с помощью заранее сгенерированных массивов, индексом является умножаемое число.
C
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
__constant__ unsigned char f_16[256] =  // остальные массивы такие же по размеру
{
    0x0, 0x10, 0x20, 0x30, 0x40, 0x50, 0x60, 0x70, 0x80, 0x90, 0xa0, 0xb0, 0xc0, 0xd0, 0xe0, 0xf0,
    0xc3, 0xd3, 0xe3, 0xf3, 0x83, 0x93, 0xa3, 0xb3, 0x43, 0x53, 0x63, 0x73, 0x3, 0x13, 0x23, 0x33,
    0x45, 0x55, 0x65, 0x75, 0x5, 0x15, 0x25, 0x35, 0xc5, 0xd5, 0xe5, 0xf5, 0x85, 0x95, 0xa5, 0xb5,
    0x86, 0x96, 0xa6, 0xb6, 0xc6, 0xd6, 0xe6, 0xf6, 0x6, 0x16, 0x26, 0x36, 0x46, 0x56, 0x66, 0x76,
    0x8a, 0x9a, 0xaa, 0xba, 0xca, 0xda, 0xea, 0xfa, 0xa, 0x1a, 0x2a, 0x3a, 0x4a, 0x5a, 0x6a, 0x7a,
    0x49, 0x59, 0x69, 0x79, 0x9, 0x19, 0x29, 0x39, 0xc9, 0xd9, 0xe9, 0xf9, 0x89, 0x99, 0xa9, 0xb9,
    0xcf, 0xdf, 0xef, 0xff, 0x8f, 0x9f, 0xaf, 0xbf, 0x4f, 0x5f, 0x6f, 0x7f, 0xf, 0x1f, 0x2f, 0x3f,
    0xc, 0x1c, 0x2c, 0x3c, 0x4c, 0x5c, 0x6c, 0x7c, 0x8c, 0x9c, 0xac, 0xbc, 0xcc, 0xdc, 0xec, 0xfc,
    0xd7, 0xc7, 0xf7, 0xe7, 0x97, 0x87, 0xb7, 0xa7, 0x57, 0x47, 0x77, 0x67, 0x17, 0x7, 0x37, 0x27,
    0x14, 0x4, 0x34, 0x24, 0x54, 0x44, 0x74, 0x64, 0x94, 0x84, 0xb4, 0xa4, 0xd4, 0xc4, 0xf4, 0xe4,
    0x92, 0x82, 0xb2, 0xa2, 0xd2, 0xc2, 0xf2, 0xe2, 0x12, 0x2, 0x32, 0x22, 0x52, 0x42, 0x72, 0x62,
    0x51, 0x41, 0x71, 0x61, 0x11, 0x1, 0x31, 0x21, 0xd1, 0xc1, 0xf1, 0xe1, 0x91, 0x81, 0xb1, 0xa1,
    0x5d, 0x4d, 0x7d, 0x6d, 0x1d, 0xd, 0x3d, 0x2d, 0xdd, 0xcd, 0xfd, 0xed, 0x9d, 0x8d, 0xbd, 0xad,
    0x9e, 0x8e, 0xbe, 0xae, 0xde, 0xce, 0xfe, 0xee, 0x1e, 0xe, 0x3e, 0x2e, 0x5e, 0x4e, 0x7e, 0x6e,
    0x18, 0x8, 0x38, 0x28, 0x58, 0x48, 0x78, 0x68, 0x98, 0x88, 0xb8, 0xa8, 0xd8, 0xc8, 0xf8, 0xe8,
    0xdb, 0xcb, 0xfb, 0xeb, 0x9b, 0x8b, 0xbb, 0xab, 0x5b, 0x4b, 0x7b, 0x6b, 0x1b, 0xb, 0x3b, 0x2b,
};
 
__device__ void R(const unsigned char* a, unsigned char* out)
{
    unsigned char l = 0;
 
    l ^= a[6];
    l ^= a[8];
    l ^= a[15];
    l ^= f_16[a[3]];
    l ^= f_16[a[11]];
    l ^= f_32[a[1]];
    l ^= f_32[a[13]];
    l ^= f_133[a[2]];
    l ^= f_133[a[12]];
    l ^= f_148[a[0]];
    l ^= f_148[a[14]];
    l ^= f_192[a[5]];
    l ^= f_192[a[9]];
    l ^= f_194[a[4]];
    l ^= f_194[a[10]];
    l ^= f_251[a[7]];
    
    out[0] = l;
    memcpy(out + 1, a, 15);
}
Может кто подскажет как ускорить или укажет на ошибки.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
06.01.2017, 20:13
Здравствуйте! Я подобрал для вас темы с ответами на вопрос Ускорение доступа к элементам массива CUDA (CUDA):

Не запускается приложение под Cuda (CUDA directory not found) - CUDA
Здравствуйте, пытаюсь скомпилировать приложение под Cuda но вылазит ошибка, что CUDA directory not found. В чем может быть проблема? Cuda...

Скорость доступа к элементам массива различными способами - C#
Народ, кто-нить исследовал тему, наиболее скоростного доступа к массивам и операции с элеменами и блоками? Может кто знает статьи? ...

Использование указателей для доступа к элементам массива - C (СИ)
Помогите пожалуйста написать программу с подробным обьяснением:. Использование указателей для доступа к элементам массива 1. Описать...

Небольшая прога по методам доступа к элементам массива - C++
Смысл такой, имеется трехмерный массив A. Данные считываются с файла(тут все верно). Хотелось бы обращаться к элементам данного массива по...

Напишите цикл for для доступа к элементам массива в обратном порядке - C++
Правильно ли? #include <iostream> using namespace std; int main() { int size; cout << "Enter number: "; cin >>...

Записать синтаксис объявления и определения свойства класса для доступа к элементам двухмерного массива данны - Delphi
Записать синтаксис объявления и определения свойства класса для доступа к элементам двухмерного массива данных

6
HighPredator
5541 / 1854 / 346
Регистрация: 10.12.2010
Сообщений: 5,472
Записей в блоге: 2
09.01.2017, 10:38 #2
Крайне сложно сказать, ибо мало информации. В частности про а.
0
Colt_11
6 / 6 / 1
Регистрация: 18.01.2016
Сообщений: 61
09.01.2017, 11:52  [ТС] #3
Изначально данные загружаются здесь, функция R вызывается из LSX, sharedOpenText это a, sharedChipherText это out.
C
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
__global__ void encryption(TextBlock* openText, TextBlock*  keys, unsigned int length, int t, const int maxThreads, const int index)
{
    long thread = blockIdx.x * maxThreads + threadIdx.x;
 
    if (thread < t && index >= 0)
    {
 
        unsigned char sharedOpenText[16];
        unsigned char sharedChipherText[16];
        unsigned char sharedKey[16];
 
        *((TextBlock*)sharedKey) = *keys;
 
        *((TextBlock*)sharedOpenText) = openText[thread];
        
        __syncthreads();
 
 
        X(sharedOpenText, sharedKey, sharedChipherText);
    
        if (index < 9)
        {
            LSX(sharedOpenText, 0, sharedChipherText);
        }
 
        __syncthreads();
        
        openText[thread] = *((TextBlock*)sharedChipherText);
        
    }
    
}
0
HighPredator
5541 / 1854 / 346
Регистрация: 10.12.2010
Сообщений: 5,472
Записей в блоге: 2
09.01.2017, 11:59 #4
А, теперь понял. Ну по сути, если это действительно узкое место, то я бы для каждого из потоков предрассчитал таблицы а и на их основании l для всех потоков, сведя действия в параллельных секциях до memcpy данных.
0
Colt_11
6 / 6 / 1
Регистрация: 18.01.2016
Сообщений: 61
09.01.2017, 12:09  [ТС] #5
Можете поподробнее объяснить, а то я немного не понял что вы имеете ввиду.
0
HighPredator
5541 / 1854 / 346
Регистрация: 10.12.2010
Сообщений: 5,472
Записей в блоге: 2
09.01.2017, 14:01 #6
Имелось ввиду нечто подобное, если конечно архитектура приложения позволяет малой кровью:
Код
{
  // at some place where all threadId's are known.

  for each threadId do
    thread <- blockIdx.x * maxThreads + threadIdx.x;
    sharedOpenTextArray[thread] <- openText[thread];
    arrayOfL[thread] <- calcL(sharedOpenTextArray[thread]); // calculate 'l' like in R function
  end for // now all is pre-calculated

  // threads are being spawned here and code executed

  encryption(...)
  {
    // ...
    _syncthreads();

    LSX(arrayOfL[thread], 0, sharedCipherText); // we don't calculate 'l' here in 'R' anymore

    _syncthreads();
    // ...
  }
}
0
Colt_11
6 / 6 / 1
Регистрация: 18.01.2016
Сообщений: 61
09.01.2017, 14:13  [ТС] #7
Спасибо. Идею понял но к сожалению не подойдет так как функция R это не узкое место, а основное вычисление на котором строится приложение и обойти его нельзя.
0
09.01.2017, 14:13
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
09.01.2017, 14:13
Привет! Вот еще темы с ответами:

Скорость, касательное ускорение, полное ускорение, нормальное ускорение и радиус кривизны траектории - Механика
Движение точки задано координатным способом. Найти траекторию и начертить ее. Кроме того определить скорость, касательное ускорение, полное...

Время доступа к элементам - Java SE
Подскажите, как определить время доступа к эл-там массива двумерного и одномерного. Задача: Нулевые эл-ты размещены в левой половине...

Ограничение доступа к элементам UI - Программирование Android
Здравствуйте уважаемые android разработчики. Будьте так добры помочь ламеру в доработки приложения. Мне необходимо чтобы после выполнения...

Куча сложность доступа к элементам - Алгоритмы
Добрый день! Сломал голову, не могу определиться. Какая алгоритмическая сложность доступа к элементам кучи. Например есть...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
7
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru