Форум программистов, компьютерный форум, киберфорум
Наши страницы
Assembler: математика, вычисления
Войти
Регистрация
Восстановить пароль
 
Рейтинг 4.67/3: Рейтинг темы: голосов - 3, средняя оценка - 4.67
SeryZone
56 / 28 / 18
Регистрация: 09.03.2012
Сообщений: 726
Записей в блоге: 1
1

Непонятно с FPU

26.05.2014, 16:29. Просмотров 586. Ответов 7
Метки нет (Все метки)

Доброго времени суток!!!
Хочу вычислить формулу
round( ( log2(tmp/min) )/step * 4095 )

Вот мой набросок:
Delphi
1
2
3
4
5
6
7
8
9
10
11
12
13
14
                asm
                  finit
                  fld dword [C4095] //st3
                  fld dword [step]  //st2
                  fld dword [min]   //st1
                  fld dword [tmp]   //st0
 
                  fdiv st0, st1
                  fyl2x
                  fdiv st, st(2)
                  fmul st, st(3)
 
                  fst dword [tmp]
                end;
Помогите!!! Как загружать это дело последовательно, если даже FYL2X это не чисто логарифм, а log2(ST0)*ST1??? Что мне делать?

Добавлено через 22 минуты
Ха! Сделал, вчитываясь в каждую строчку учебника FASM'a...

Delphi
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
                asm
                  finit
 
                  fld dword [tmp]   //st1
                  fild dword [min]   //st0
 
                  fdivp st(1), st(0)
                  fld st
                  fyl2x
                  fld dword [step]
                  fdivp st(1), st
                  fld dword [C4095]
                  fmulp st(1), st
                  frndint
 
                  fistp dword [ColorIndex]
                end;
Всё работает (право, медленнее, чем стандартный код делфи)!

Добавлено через 2 минуты
Гм! А без FINIT наоборот, быстрее! =)
0
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
26.05.2014, 16:29
Ответы с готовыми решениями:

FPU
Привет дело такое. Не могу понять как рабатают FPU пример: mov dword ptr ds:,10000000 FILD...

GCC FPU x^y
Есть такой код-асм. вставка. По ходу написания которого выяснилось что для f2xm1 st(0) должен...

Calculate, using FPU, the following expression
Calculate, using FPU, the following expression: N P=E ((i!)/N+i^2)! i=1 Input data...

Calculate, using FPU, the following expression
Calculate, using FPU, the following expression: (3+e^y-1)/((1+x^2)*|y-ctg z| Input data need...

Флаги исключений fpu
Не мог понять как их считывать. или просто отловить исключительную ситуацию. (деление на ноль,...

7
Mikl___
Автор FAQ
13304 / 6377 / 629
Регистрация: 11.11.2010
Сообщений: 11,539
26.05.2014, 17:52 2
Assembler
1
2
3
4
5
6
7
fld [tmp]
fidiv [min]
fld st
fyl2x
fdiv [step]
fmul [C4095]
fistp [ColorIndex]
1
Somebody
2808 / 1619 / 251
Регистрация: 03.12.2007
Сообщений: 4,223
Завершенные тесты: 3
26.05.2014, 20:23 3
fyl2x - это y*log2(x), так что, наверное
Assembler
1
2
3
4
5
6
fld [C4095]
fld [tmp]
fidiv [min]
fyl2x
fdiv [step]
fistp [ColorIndex]
?
И математику тут ещё, скорее всего, можно оптимизироваить... Например, если это будет крутиться в цикле, где изменяется только tmp (я правильно догадался?), тогда:
t1 = 4095 / step
t2 = mul1 * log2(min)
остаётся:
round(log2(tmp) * t1 - t2)
1
SeryZone
56 / 28 / 18
Регистрация: 09.03.2012
Сообщений: 726
Записей в блоге: 1
26.05.2014, 20:43  [ТС] 4
Благодарю. Но всё-равно, выдаёт одинаковый результат скорости (390ms) в моих вычислениях. Я сейчас "Веду сражение" с циклами и SIMD отдельно...
0
Mikl___
Автор FAQ
13304 / 6377 / 629
Регистрация: 11.11.2010
Сообщений: 11,539
27.05.2014, 02:32 5
SeryZone,
  1. я думаю, что умножение на целое число 4095 можно заменить на сдвиг и вычитание Х*4095=Х<<12 -Х
  2. операции frndint и fistp вполне можно заменить только fistp
0
SeryZone
56 / 28 / 18
Регистрация: 09.03.2012
Сообщений: 726
Записей в блоге: 1
27.05.2014, 22:20  [ТС] 6
Mikl___, Так, сдвиг для числа с плавающей точкой, я правильно понял?
FRNDINT убрал. Но стандартный таймер дельфи всё так же выдаёт 390мс...
0
murderer
3326 / 1472 / 135
Регистрация: 06.10.2010
Сообщений: 3,233
06.06.2014, 08:49 7
Так, сдвиг для числа с плавающей точкой, я правильно понял?
На FPU есть FSCALE.

Добавлено через 1 минуту
Покажи весь цикл.
0
SeryZone
56 / 28 / 18
Регистрация: 09.03.2012
Сообщений: 726
Записей в блоге: 1
06.06.2014, 17:11  [ТС] 8
murderer, Сорри, сейчас пока не надо. Я логарифм заменил корнем шестнадцатой степени на SSE (sqrt(sqrt(sqrt(sqrt(x)))). Это дало мне возможность вычислять 4 точки почти с таким же результатом!

Добавлено через 23 секунды
Delphi
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
procedure sqrtSSE(min, step:FourFPack; out tmp:FourFPack);
asm
  push esi
  push edi
  push edx
  mov edi, tmp
  mov esi, min
  mov edx, step
  movups xmm0, [edi]
  sqrtps xmm0, xmm0
  movups xmm1, [esi]
  subps xmm0, xmm1
  movups xmm1, [edx]
  mulps  xmm0, xmm1
  movups [edi], xmm0
  pop edx
  pop edi
  pop esi
end;
 
   begin
        index := 0;
        x := 0;
        minSSE.a:=min;;
        StepSSE.a:=1/((sqrt(max)-sqrt(min))/4095.0);   Fill1SSE(stepSSE);
        minSSE.a:=sqrt(min);                           Fill1SSE(minSSE);
 
        While x<(maxx*maxy-1) do
          begin
            tmpSSE.a := (IterDat[x]);
            tmpSSE.b := (IterDat[x+1]);
            tmpSSE.c := (IterDat[x+2]);
            tmpSSE.d := (IterDat[x+3]);
            SqrtSSE(minSSE, StepSSE, tmpSSE);
            ColorIndexSSE.a:=round(tmpSSE.a);
            ColorIndexSSE.b:=round(tmpSSE.b);
            ColorIndexSSE.c:=round(tmpSSE.c);
            ColorIndexSSE.d:=round(tmpSSE.d);
            if (ColorIndexSSE.a>4095) then ColorIndexSSE.a:=0;
            if (ColorIndexSSE.b>4095) then ColorIndexSSE.b:=0;
            if (ColorIndexSSE.c>4095) then ColorIndexSSE.c:=0;
            if (ColorIndexSSE.d>4095) then ColorIndexSSE.d:=0;
            buffer[index]  :=  pal[ColorIndexSSE.a].b;
            buffer[index+1] := pal[ColorIndexSSE.a].g;
            buffer[index+2] := pal[ColorIndexSSE.a].r;
            inc(index, 4);
            buffer[index]  :=  pal[ColorIndexSSE.b].b;
            buffer[index+1] := pal[ColorIndexSSE.b].g;
            buffer[index+2] := pal[ColorIndexSSE.b].r;
            inc(index, 4);
            buffer[index]  :=  pal[ColorIndexSSE.c].b;
            buffer[index+1] := pal[ColorIndexSSE.c].g;
            buffer[index+2] := pal[ColorIndexSSE.c].r;
            inc(index, 4);
            buffer[index]  :=  pal[ColorIndexSSE.d].b;
            buffer[index+1] := pal[ColorIndexSSE.d].g;
            buffer[index+2] := pal[ColorIndexSSE.d].r;
            inc(index, 4);
            inc(x,4);
          end;
      end;
0
06.06.2014, 17:11
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
06.06.2014, 17:11

Вычисление факториала на FPU
Добрый день. Помогите разобраться с вычислением факториала на FPU. include...

Calculate, using FPU, the following expression

Вычисление выражения по формуле с FPU
Входные данные необходимо вводить с клавиатуры; результат должен быть выведен на консоль.


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2019, vBulletin Solutions, Inc.
Рейтинг@Mail.ru