Форум программистов, компьютерный форум, киберфорум
Assembler: математика, вычисления
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/9: Рейтинг темы: голосов - 9, средняя оценка - 4.67
17 / 17 / 1
Регистрация: 22.02.2012
Сообщений: 116

Падение производительности в 25 раз и ошибка функции при использовании DLL

22.02.2012, 15:25. Показов 1907. Ответов 14
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Написал на С++(сами функции на ассемблере с помощью вставки) библиотеку DLL. Вызываю функцию из VB.NET. Замеряю скорость относительно такой же функции написанной на бейсике.
Проблемы:
1) Функция на асме работает в 20-30 раз МЕДЛЕННЕЕ(проверял с большим количеством вызовов в цикле)
2) При первом вызове возвращает правильные значения,при последующих возвращает NaN.
Прошу помочь разобраться.
Функция должна возвращать точку пересечения двух прямых,которые представлены в виде Ax+By+C=0.
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
#include "stdafx.h" 
 
struct line{ 
   float a; 
   float b; 
   float c;}; 
struct point{ 
   float x; //х координата 
   float y; //у координата 
   int ex;}; //признак ошибки(если прямые параллельны или совпадают) 
 
extern "C" __declspec(dllexport) point __stdcall LXL(line l1,line l2) { 
   point lxl; 
      _asm{ 
         finit //Инициализация 
         fldz //Загружаем 0 для дальнейшего сравнения 
         fld l1.a //Выполняем 1 этап вычислений 
         fld l2.b 
         fmulp st(1),st 
         fld l2.a 
         fld l1.b 
         fmulp st(1),st 
         fsubp st(1),st 
         fcomi st,st(1) //Если результат 0 - ошибка 
         je error         //Выход 
         fld l1.b          // Находим Х 
         fld l2.c 
         fmulp st(1),st 
         fld l2.b 
         fld l1.c 
         fmulp st(1),st 
         fsubp st(1),st 
         fdiv st,st(1) 
         fstp lxl.x 
         fld l1.c            //Находим У 
         fld l2.a 
         fmulp st(1),st 
         fld l2.c 
         fld l1.a 
         fmulp st(1),st 
         fsubp st(1),st 
         fdiv st,st(1) 
         fst lxl.y 
         mov lxl.ex,0 //Устанавливаем признак ошибки в 0
   }; 
   return lxl; //Возвращаем точку пересечения 
error: 
   lxl.ex = 1; //Признак ошибки 
   return lxl; 
} ;
На бейсике:
VB.NET
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
Public Class Form1 
    'Функция находит точку пересечения двух прямых 
    Private Declare Function LXL Lib "LineXLine" (ByVal l1 As line, ByVal l2 As line) As pointw 
    Private Sub Button1_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles Button1.Click 
        'Готовим входные данные 
        Dim l1, l2 As line 
        With l1 
            .a = 10 
            .b = 20 
            .c = 30 
        End With 
        With l2 
            .a = 5 
            .b = -20 
            .c = 30 
        End With 
        'Находим точку пересечения двух прямых 
        Dim p1 As pointw 
        p1 = LXL(l1, l2) 
        'p1 = LXL(l1, l2) 'Если раскомментировать - выдаст другой результат 
        MsgBox(String.Format("{0} - {1}", p1.X, p1.Y)) 
    End Sub 
    Private Function LineXLine(ByVal L1 As line, ByVal L2 As line) As pointw 'такая же функция на бейсике
        Dim V As Double = L1.a * L2.b - L2.a * L1.b 
        If V Then 'если не ноль - прямые не параллельны и не совпадают
            LineXLine.X = ((L1.b * L2.c - L2.b * L1.c) / V) 
            LineXLine.Y = ((L1.c * L2.a - L2.c * L1.a) / V) 
            Exit Function 'возвращаем точку пересечения
        End If 
        LineXLine.Ex = 1 : Exit Function ' возвращаем ошибку
    End Function
    Structure pointw  'Структура точки 
        Dim X, Y As Single 
        Dim Ex As Integer ' Установлен в 1 если ошибка 
    End Structure 
    Structure line ' Структура прямой 
        Dim a, b, c As Single 
    End Structure 
End Class
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
22.02.2012, 15:25
Ответы с готовыми решениями:

Падение программы при вызове функции из DLL
Есть код на C++ #ifdef __WIN32__ #define MY_EXPORT __declspec(dllexport) #else #define MY_EXPORT #endif extern "C"...

Ошибка при использовании DLL
код - длл function AuthCheck(User, HWID, GOOD: string ; id:integer): string; export; var HTTP: THTTPSEND; HTML: TSTringlist;...

Ошибка при использовании DLL
Функция описанная в ДЛЛ ошибок нет. тестировалась отдельно. Procedure Bnw (var img: tbitmap); var i, j: integer; y: byte; begin ...

14
4190 / 1838 / 221
Регистрация: 06.10.2010
Сообщений: 4,124
22.02.2012, 15:42
v=L1.a * L2.b - L2.a * L1.b
x=L1.b * L2.c - L2.b * L1.c
y=L1.c * L2.a - L2.c * L1.a
x=x/v
y=y/v
Юзай SSE
1
17 / 17 / 1
Регистрация: 22.02.2012
Сообщений: 116
22.02.2012, 15:49  [ТС]
murderer,
Ну, я об этом думал,но проблемы это не решает. 1:25 в пользу бейсика никаким SSE не победишь.Где-то ошибка и поэтому выдает нечисла при повторном вызове функции.Возможно из-за этого и производительность падает.
0
4190 / 1838 / 221
Регистрация: 06.10.2010
Сообщений: 4,124
22.02.2012, 17:12
Параметры лучше передавать указателями. Функцию объявить как naked. Ну и конечно же SSE.
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
__declspec(naked) void __stdcall LXLSSE(line* l1,line* l2, point* p) { 
__asm{
    mov      eax,[esp+4]
    mov      ecx,[esp+8]
    mov      edx,[esp+12]
    movups   xmm0,[eax]
    movups   xmm1,[ecx]
    movaps   xmm2,xmm0
    movaps   xmm3,xmm1
    shufps   xmm2,xmm2,1001b
    shufps   xmm3,xmm3,1001b
    mulps    xmm0,xmm2
    mulps    xmm1,xmm3
    xorps    xmm5,xmm5
    subps    xmm0,xmm1
    comiss   xmm0,xmm5
    mov      dword ptr[edx+8],1
    jz error
      movsldup xmm1,xmm0
      shufps   xmm0,xmm0,1001b
      divps    xmm0,xmm1
      movups   [edx],xmm0
      mov      dword ptr[edx+8],0
    error:
    ret 12
    }
}
1
17 / 17 / 1
Регистрация: 22.02.2012
Сообщений: 116
22.02.2012, 18:46  [ТС]
murderer, большое спасибо! Попробую разбираться,хотя SSE я еще не учил.
Также хотелось бы докопаться до истины, чтоб не повторять ошибки.Почему же мой код не рабочий и почему при повторном вызове функция возвращает NaN? Нашел еще кое-какие очень странные улики.
При изменении функции так,чтоб она принимала только числа типа float функция работает постоянно правильно,но при выводе на форму информации "засирается" один из Лебелов:

Когда я закомментировал вывод в тот испорченый Лебел,начал портится предыдущий по счету:

И,наконец, если вообще не пользоваться функцией DLL, вывод нормальный.

Все это не укладывается в голове.
0
17 / 17 / 1
Регистрация: 22.02.2012
Сообщений: 116
22.02.2012, 19:04  [ТС]
Вставил новый код,но теперь не знаю как вызвать такую функцию из бейсика.
0
17 / 17 / 1
Регистрация: 22.02.2012
Сообщений: 116
29.02.2012, 18:41  [ТС]
Немного поковырявшись, я понял что "после себя" нужно восстановить стек сопроцессора в былое состояние чтоб не появлялось ошибок.
murderer, спасибо за помощь. Я научился юзать SSE.Чуть шлифанул Ваш код и немного изменил чтоб работал:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
 extern "C" __declspec(dllexport) point __stdcall LXLXMM(line l1,line l2){  
__asm{
    mov      eax,[ebp+8]
    movups   xmm0,[ebp+12]
    movups   xmm1,[ebp+24]
    movaps   xmm2,xmm0
    movaps   xmm3,xmm1
    shufps   xmm2,xmm2,1001b
    shufps   xmm3,xmm3,1001b
    mulps    xmm0,xmm3
    mulps    xmm1,xmm2
    xorps    xmm5,xmm5
    subps    xmm0,xmm1
    comiss   xmm0,xmm5
    mov      dword ptr[eax+8],1
    jz error
    movaps   xmm1,xmm0
    shufps   xmm1,xmm0,00000000b
    shufps   xmm0,xmm0,1001b
    divps    xmm0,xmm1
    movlps   [eax],xmm0
    mov      dword ptr[eax+8],0}
error:;
};
Скорость выросла в 1.7 раза по сравнению с программированием FPU,но зараза бейсик всеравно ведет - почти 1:2!!! Как это можно объяснить? Ведь асм должен быть быстрее!!!
0
4190 / 1838 / 221
Регистрация: 06.10.2010
Сообщений: 4,124
29.02.2012, 19:20
Ты определяешь функцию так
C++
1
__declspec(dllexport) point __stdcall LXLXMM(line l1,line l2)
Это порождает много лишнего кода.
Например при вызове
C++
1
a=LXLXMM(l1,l2);
Вначале создаётся временная переменная для результата. Затем в стек помещается 28 байт (12 - l1 + 12 - l2 + 4 - указатель на временную переменную). Затем после окончания расчётов выполняется копирование из времменной переменной в переменную a. К тому же создаётся кадр стека (push ebp / mov ebp,esp / pop ebp).

Если объявить так
C++
1
__declspec(naked) void __stdcall LXLSSE(line* l1,line* l2, point* p) {
вызов функции немного изменится
C++
1
LXLXMM(&l1,&l2,&a);
При этом кадр стека создаваться не будет (к параметрам будем обращаться напрямую через esp). В стек будет передаваться 12 байт (3 указателя) вместо 28. Результат будет записываться напрямую в переменную a без создания временного буффера.
1
17 / 17 / 1
Регистрация: 22.02.2012
Сообщений: 116
01.03.2012, 14:34  [ТС]
Реализовал 4 функции:
1) На бейсике (BAS)
2) На асме с использованием команд сопроцессора (FPU)
3) На асме с использованием SSE,передача по значению:
extern "C" __declspec(dllexport) point __stdcall LXLXMM(line l1,line l2) (SSEDLL)
4) На асме с исп.SSE,передача по ссылке:
__declspec(naked) void __stdcall LXLSSE(line* l1,line* l2, point* p) (SSENAKED)
Замеры времени выполнения функций производил попарно с помощью QueryPerformanceCounter и StopWatcher. Результаты этих инструментов не отличаются.
Результаты замеров производительности пар функций:
FPU --- и --- BAS
6,529002 --- 2,335708 - Bas быстрее в 2.79 раза

FPU --- и --- SSEDLL
6,542697 --- 3,959343 - SSEDLL быстрее в 1,65 раза

FPU --- и --- SSENAKED
27,772090 --- 10,874160 - SSENAKED быстрее в 2,55 раза,НО ВРЕМЯ FPU УВЕЛИЧИЛОСЬ!!

BAS --- и --- SSEDLL
2,174434 --- 4,229036 - BAS ,быстрее в 1.94 раза

BAS --- и --- SSE-NAKED
13,020228 --- 10,871905 - SSENAKED быстрее в 1.19 раза,НО ВРЕМЯ BAS УВЕЛИЧИЛОСЬ!!

SSEDLL --- и --- SSE-NAKED
24,943392 --- 11,455869 - SSENAKED быстрее в 2.18 раза,НО ВРЕМЯ SSE-DLL УВЕЛИЧИЛОСЬ!!

Что замедляет функции когда используется SSENAKED????

Код SSENAKED на С++:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
  __declspec(naked) void __stdcall LXLXMMN(line *l1,line *l2,point *p){  
__asm{
    mov      eax,[esp+4]
    mov      ebx,[esp+8]
    mov      edx,[esp+12]
    movups   xmm0,[eax]
    movups   xmm1,[ebx]
    movaps   xmm2,xmm0
    movaps   xmm3,xmm1
    shufps   xmm2,xmm2,1001b
    shufps   xmm3,xmm3,1001b
    mulps    xmm0,xmm3
    mulps    xmm1,xmm2
    xorps    xmm5,xmm5
    subps    xmm0,xmm1
    comiss   xmm0,xmm5
    mov      dword ptr[edx+8],1
    jz error
    movaps   xmm1,xmm0
    shufps   xmm1,xmm0,00000000b
    shufps   xmm0,xmm0,1001b
    divps    xmm0,xmm1
    movlps   [edx],xmm0
    mov      dword ptr[edx+8],0
error:  
    ret 12}};
Дизассемблерный код SSENAKED:
Assembler
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
; void __stdcall LXLXMMN(struct line *, struct line *, struct point *)
.text:10001130                 public ?LXLXMMN@@YGXPAUline@@0PAUpoint@@@Z
.text:10001130 ?LXLXMMN@@YGXPAUline@@0PAUpoint@@@Z proc near
.text:10001130
.text:10001130 RefLine1        = dword ptr  4
.text:10001130 RefLine2        = dword ptr  8
.text:10001130 RefPoint        = dword ptr  0Ch
.text:10001130
.text:10001130                 mov     eax, [esp+RefLine1]
.text:10001134                 mov     ebx, [esp+RefLine2]
.text:10001138                 mov     edx, [esp+RefPoint]
.text:1000113C                 movups  xmm0, oword ptr [eax]
.text:1000113F                 movups  xmm1, oword ptr [ebx]
.text:10001142                 movaps  xmm2, xmm0
.text:10001145                 movaps  xmm3, xmm1
.text:10001148                 shufps  xmm2, xmm2, 1001b
.text:1000114C                 shufps  xmm3, xmm3, 1001b
.text:10001150                 mulps   xmm0, xmm3
.text:10001153                 mulps   xmm1, xmm2
.text:10001156                 xorps   xmm5, xmm5
.text:10001159                 subps   xmm0, xmm1
.text:1000115C                 comiss  xmm0, xmm5
.text:1000115F                 mov     dword ptr [edx+8], 1
.text:10001166                 jz      short locret_10001180
.text:10001168                 movaps  xmm1, xmm0
.text:1000116B                 shufps  xmm1, xmm0, 0
.text:1000116F                 shufps  xmm0, xmm0, 1001b
.text:10001173                 divps   xmm0, xmm1
.text:10001176                 movlps  qword ptr [edx], xmm0
.text:10001179                 mov     dword ptr [edx+8], 0
.text:10001180
.text:10001180 locret_10001180:                        ; CODE XREF: LXLXMMN(line *,line *,point *)+36j
.text:10001180                 retn    0Ch
.text:10001180 ?LXLXMMN@@YGXPAUline@@0PAUpoint@@@Z endp
0
4190 / 1838 / 221
Регистрация: 06.10.2010
Сообщений: 4,124
01.03.2012, 15:29
Что замедляет функции когда используется SSENAKED????
В бейсике есть отладчик с дизасмом? Посмотри как происходит вызов функции SSENAKED, сравни значение esp до и после вызова.

Можно ещё немного ускорить если найти способ выравнять данные по границе 16 байт в бейсике.
0
17 / 17 / 1
Регистрация: 22.02.2012
Сообщений: 116
01.03.2012, 15:42  [ТС]
murderer, Есть дизасм,но он показывает только CIL код.Там нет регистров.
0
4190 / 1838 / 221
Регистрация: 06.10.2010
Сообщений: 4,124
02.03.2012, 07:14
Сделай два последовательных вызова SSENAKED. Потом в olly поставь брейкпоинт на этой функции.
Если не ошибаюсь это делается так:
1) View->Executable modules
2) Правой кнопкой на имя твоей dll -> Show names
3) Находишь имя своей функции и щёлкаешь даблкликом
4) В открывшемся окне кода вызываешь контекстное меню -> Breakpoint -> Hardware -> Ok

Таким образом можно потрассировать и увидеть сколько промежуточного кода выполняется между вызовами функций. Не удивлюсь если этот промежуточный код выполняется медленнее, чем сама функция.
0
17 / 17 / 1
Регистрация: 22.02.2012
Сообщений: 116
03.03.2012, 21:53  [ТС]
В Show names нет моей функции.
0
4190 / 1838 / 221
Регистрация: 06.10.2010
Сообщений: 4,124
04.03.2012, 06:14
Компилятор c++ может изменить имя. По коду из поста №9 можно предположить, что функция называется ?LXLXMMN@@YGXPAUline@@0PAUpoint@@@Z.
1
17 / 17 / 1
Регистрация: 22.02.2012
Сообщений: 116
04.03.2012, 15:15  [ТС]
функцию нашел,имя у нее обычное LXLXMMN, но появляется она только в процессе работы программы,т.к. подгружается не сразу. Перед ней и после нее много кода и вызывается какая-то функция kernel.GetLastError. Что это может быть?

Добавлено через 37 минут
Вызов функции в NET очень отличается от вызова в С++. В NET полно какого-то кода совсем мне непонятного.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
04.03.2012, 15:15
Помогаю со студенческими работами здесь

Ошибка при использовании C++ dll в C#
У меня есть C++ библиотека (task.dll) и к ней вот такая шапка: #include "extcode.h" #pragma pack(push) #pragma pack(1) ...

Ошибка при использовании dll файла
Здравствуйте! Поставили мне задачу: использовать .dll в своей проге. Как человек, никогда этим не знамавшийся, я все загуглила, нашла...

Ошибка при использовании процедуры из DLL
Скрин самой ошибки Проект dll library Project2; uses SysUtils, Classes;

Ошибка при использовании DLL, написанной на VBA
Добрый день Подскажите пожалуйста. Я пытаюсь вызвать метод класса Gatherer.RelSetAgeDay(5) выдается ошибка " Не удается загрузить...

Падение производительности при подключении к Интернету
Проблема в том, что производительность графики в играх на моем ноутбуке сильно падает сразу после подключения к Интернету. До подключения к...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
15
Ответ Создать тему
Новые блоги и статьи
Подключение Box2D v3 к SDL3 для Android: физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования. Часть библиотеки BedvitCOM Использованы. . .
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL3_image
8Observer8 27.01.2026
Содержание блога SDL3_image - это библиотека для загрузки и работы с изображениями. Эта пошаговая инструкция покажет, как загрузить и вывести на экран смартфона картинку с альфа-каналом, то есть с. . .
Влияние грибов на сукцессию
anaschu 26.01.2026
Бифуркационные изменения массы гриба происходят тогда, когда мы уменьшаем массу компоста в 10 раз, а скорость прироста биомассы уменьшаем в три раза. Скорость прироста биомассы может уменьшаться за. . .
Воспроизведение звукового файла с помощью SDL3_mixer при касании экрана Android
8Observer8 26.01.2026
Содержание блога SDL3_mixer - это библиотека я для воспроизведения аудио. В отличие от инструкции по добавлению текста код по проигрыванию звука уже содержится в шаблоне примера. Нужно только. . .
Установка Android SDK, NDK, JDK, CMake и т.д.
8Observer8 25.01.2026
Содержание блога Перейдите по ссылке: https:/ / developer. android. com/ studio и в самом низу страницы кликните по архиву "commandlinetools-win-xxxxxx_latest. zip" Извлеките архив и вы увидите. . .
Вывод текста со шрифтом TTF на Android с помощью библиотеки SDL3_ttf
8Observer8 25.01.2026
Содержание блога Если у вас не установлены Android SDK, NDK, JDK, и т. д. то сделайте это по следующей инструкции: Установка Android SDK, NDK, JDK, CMake и т. д. Сборка примера Скачайте. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru