Форум программистов, компьютерный форум CyberForum.ru

C для начинающих

Войти
Регистрация
Восстановить пароль
 
Colt_11
5 / 5 / 0
Регистрация: 18.01.2016
Сообщений: 33
#1

Ускорение доступа к элементам массива CUDA - C (СИ)

06.01.2017, 20:13. Просмотров 336. Ответов 6
Метки нет (Все метки)

Всем привет!
Есть функция осуществляющая умножение и сложение в конечном поле. Умножения осуществляется с помощью заранее сгенерированных массивов, индексом является умножаемое число.
C
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
__constant__ unsigned char f_16[256] =  // остальные массивы такие же по размеру
{
    0x0, 0x10, 0x20, 0x30, 0x40, 0x50, 0x60, 0x70, 0x80, 0x90, 0xa0, 0xb0, 0xc0, 0xd0, 0xe0, 0xf0,
    0xc3, 0xd3, 0xe3, 0xf3, 0x83, 0x93, 0xa3, 0xb3, 0x43, 0x53, 0x63, 0x73, 0x3, 0x13, 0x23, 0x33,
    0x45, 0x55, 0x65, 0x75, 0x5, 0x15, 0x25, 0x35, 0xc5, 0xd5, 0xe5, 0xf5, 0x85, 0x95, 0xa5, 0xb5,
    0x86, 0x96, 0xa6, 0xb6, 0xc6, 0xd6, 0xe6, 0xf6, 0x6, 0x16, 0x26, 0x36, 0x46, 0x56, 0x66, 0x76,
    0x8a, 0x9a, 0xaa, 0xba, 0xca, 0xda, 0xea, 0xfa, 0xa, 0x1a, 0x2a, 0x3a, 0x4a, 0x5a, 0x6a, 0x7a,
    0x49, 0x59, 0x69, 0x79, 0x9, 0x19, 0x29, 0x39, 0xc9, 0xd9, 0xe9, 0xf9, 0x89, 0x99, 0xa9, 0xb9,
    0xcf, 0xdf, 0xef, 0xff, 0x8f, 0x9f, 0xaf, 0xbf, 0x4f, 0x5f, 0x6f, 0x7f, 0xf, 0x1f, 0x2f, 0x3f,
    0xc, 0x1c, 0x2c, 0x3c, 0x4c, 0x5c, 0x6c, 0x7c, 0x8c, 0x9c, 0xac, 0xbc, 0xcc, 0xdc, 0xec, 0xfc,
    0xd7, 0xc7, 0xf7, 0xe7, 0x97, 0x87, 0xb7, 0xa7, 0x57, 0x47, 0x77, 0x67, 0x17, 0x7, 0x37, 0x27,
    0x14, 0x4, 0x34, 0x24, 0x54, 0x44, 0x74, 0x64, 0x94, 0x84, 0xb4, 0xa4, 0xd4, 0xc4, 0xf4, 0xe4,
    0x92, 0x82, 0xb2, 0xa2, 0xd2, 0xc2, 0xf2, 0xe2, 0x12, 0x2, 0x32, 0x22, 0x52, 0x42, 0x72, 0x62,
    0x51, 0x41, 0x71, 0x61, 0x11, 0x1, 0x31, 0x21, 0xd1, 0xc1, 0xf1, 0xe1, 0x91, 0x81, 0xb1, 0xa1,
    0x5d, 0x4d, 0x7d, 0x6d, 0x1d, 0xd, 0x3d, 0x2d, 0xdd, 0xcd, 0xfd, 0xed, 0x9d, 0x8d, 0xbd, 0xad,
    0x9e, 0x8e, 0xbe, 0xae, 0xde, 0xce, 0xfe, 0xee, 0x1e, 0xe, 0x3e, 0x2e, 0x5e, 0x4e, 0x7e, 0x6e,
    0x18, 0x8, 0x38, 0x28, 0x58, 0x48, 0x78, 0x68, 0x98, 0x88, 0xb8, 0xa8, 0xd8, 0xc8, 0xf8, 0xe8,
    0xdb, 0xcb, 0xfb, 0xeb, 0x9b, 0x8b, 0xbb, 0xab, 0x5b, 0x4b, 0x7b, 0x6b, 0x1b, 0xb, 0x3b, 0x2b,
};
 
__device__ void R(const unsigned char* a, unsigned char* out)
{
    unsigned char l = 0;
 
    l ^= a[6];
    l ^= a[8];
    l ^= a[15];
    l ^= f_16[a[3]];
    l ^= f_16[a[11]];
    l ^= f_32[a[1]];
    l ^= f_32[a[13]];
    l ^= f_133[a[2]];
    l ^= f_133[a[12]];
    l ^= f_148[a[0]];
    l ^= f_148[a[14]];
    l ^= f_192[a[5]];
    l ^= f_192[a[9]];
    l ^= f_194[a[4]];
    l ^= f_194[a[10]];
    l ^= f_251[a[7]];
    
    out[0] = l;
    memcpy(out + 1, a, 15);
}
Может кто подскажет как ускорить или укажет на ошибки.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
06.01.2017, 20:13     Ускорение доступа к элементам массива CUDA
Посмотрите здесь:

Присвоение значений элементам массива C (СИ)
C (СИ) Как обращаться к элементам массива структур
Обращение к элементам массива C (СИ)
Всем элементам массива присваивается ноль C (СИ)
Структура и осуществление доступа к ее элементам C (СИ)
Структура и осуществление доступа к ее элементам C (СИ)
C (СИ) Использование указателей для доступа к элементам массива
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
HighPredator
5428 / 1811 / 332
Регистрация: 10.12.2010
Сообщений: 5,360
Записей в блоге: 3
09.01.2017, 10:38     Ускорение доступа к элементам массива CUDA #2
Крайне сложно сказать, ибо мало информации. В частности про а.
Colt_11
5 / 5 / 0
Регистрация: 18.01.2016
Сообщений: 33
09.01.2017, 11:52  [ТС]     Ускорение доступа к элементам массива CUDA #3
Изначально данные загружаются здесь, функция R вызывается из LSX, sharedOpenText это a, sharedChipherText это out.
C
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
__global__ void encryption(TextBlock* openText, TextBlock*  keys, unsigned int length, int t, const int maxThreads, const int index)
{
    long thread = blockIdx.x * maxThreads + threadIdx.x;
 
    if (thread < t && index >= 0)
    {
 
        unsigned char sharedOpenText[16];
        unsigned char sharedChipherText[16];
        unsigned char sharedKey[16];
 
        *((TextBlock*)sharedKey) = *keys;
 
        *((TextBlock*)sharedOpenText) = openText[thread];
        
        __syncthreads();
 
 
        X(sharedOpenText, sharedKey, sharedChipherText);
    
        if (index < 9)
        {
            LSX(sharedOpenText, 0, sharedChipherText);
        }
 
        __syncthreads();
        
        openText[thread] = *((TextBlock*)sharedChipherText);
        
    }
    
}
HighPredator
5428 / 1811 / 332
Регистрация: 10.12.2010
Сообщений: 5,360
Записей в блоге: 3
09.01.2017, 11:59     Ускорение доступа к элементам массива CUDA #4
А, теперь понял. Ну по сути, если это действительно узкое место, то я бы для каждого из потоков предрассчитал таблицы а и на их основании l для всех потоков, сведя действия в параллельных секциях до memcpy данных.
Colt_11
5 / 5 / 0
Регистрация: 18.01.2016
Сообщений: 33
09.01.2017, 12:09  [ТС]     Ускорение доступа к элементам массива CUDA #5
Можете поподробнее объяснить, а то я немного не понял что вы имеете ввиду.
HighPredator
5428 / 1811 / 332
Регистрация: 10.12.2010
Сообщений: 5,360
Записей в блоге: 3
09.01.2017, 14:01     Ускорение доступа к элементам массива CUDA #6
Имелось ввиду нечто подобное, если конечно архитектура приложения позволяет малой кровью:
Код
{
  // at some place where all threadId's are known.

  for each threadId do
    thread <- blockIdx.x * maxThreads + threadIdx.x;
    sharedOpenTextArray[thread] <- openText[thread];
    arrayOfL[thread] <- calcL(sharedOpenTextArray[thread]); // calculate 'l' like in R function
  end for // now all is pre-calculated

  // threads are being spawned here and code executed

  encryption(...)
  {
    // ...
    _syncthreads();

    LSX(arrayOfL[thread], 0, sharedCipherText); // we don't calculate 'l' here in 'R' anymore

    _syncthreads();
    // ...
  }
}
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
09.01.2017, 14:13     Ускорение доступа к элементам массива CUDA
Еще ссылки по теме:

Сортировка строк двумерного массива по первым их элементам C (СИ)
Структура и осуществление доступа к ее элементам C (СИ)
C (СИ) Структура и осуществление доступа к ее элементам
C (СИ) Обращение к элементам массива через указатели
Структура и осуществление доступа к ее элементам C (СИ)

Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
Colt_11
5 / 5 / 0
Регистрация: 18.01.2016
Сообщений: 33
09.01.2017, 14:13  [ТС]     Ускорение доступа к элементам массива CUDA #7
Спасибо. Идею понял но к сожалению не подойдет так как функция R это не узкое место, а основное вычисление на котором строится приложение и обойти его нельзя.
Yandex
Объявления
09.01.2017, 14:13     Ускорение доступа к элементам массива CUDA
Ответ Создать тему
Опции темы

Текущее время: 22:26. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru