Форум программистов, компьютерный форум, киберфорум
Наши страницы

C++

Войти
Регистрация
Восстановить пароль
 
Nummerok
19 / 19 / 2
Регистрация: 30.05.2014
Сообщений: 431
#1

Переписать код из ASM на С++ для сборки под x64 - C++

26.01.2016, 03:36. Просмотров 459. Ответов 1
Метки нет (Все метки)

Задача: переписать код из ASM на C++ для сборки под X64
Ибо я ASM не знаю
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
#include "stdafx.h"
 
#include "xrTheora_Surface_mmx.h"
 
#pragma warning( disable : 4731 )
 
#pragma pack( push )
#pragma pack( 1 )
 
typedef tv_sshort tv_sshort_tables[ 256 ][ 4 ];
 
#pragma pack( pop )
/*
 
//. width_diff = surface_width - theora_width
 
        u32 pos = 0;
        for (u32 h=0; h<height; ++h){
 
            u8* Y       = yuv.y+yuv.y_stride*h;
            u8* U       = yuv.u+yuv.uv_stride*(h/uv_h);
            u8* V       = yuv.v+yuv.uv_stride*(h/uv_h);
 
            for (u32 w=0; w<width; ++w){
 
                u8 y    = Y[w];
                u8 u    = U[w/uv_w];
                u8 v    = V[w/uv_w];
 
                int C   = y - 16;
                int D   = u - 128;
                int E   = v - 128;
 
                int R   = clampr(( 298 * C           + 409 * E + 128) >> 8,0,255);
                int G   = clampr(( 298 * C - 100 * D - 208 * E + 128) >> 8,0,255);
                int B   = clampr(( 298 * C + 516 * D           + 128) >> 8,0,255);
 
                data[++pos] = color_rgba(R,G,B,255);
 
                if(w==(width-1))
                    pos += width_diff;
            }
        }
*/
 
lp_tv_uchar tv_yuv2argb(
                        lp_tv_uchar         argb_plane ,
                        tv_slong            argb_width ,
                        tv_slong            argb_height ,
                        lp_tv_uchar         y_plane ,
                        tv_slong            y_width ,
                        tv_slong            y_height ,
                        tv_slong            y_stride ,
                        lp_tv_uchar         u_plane ,
                        lp_tv_uchar         v_plane ,
                        tv_slong            uv_width ,
                        tv_slong            uv_height ,
                        tv_slong            uv_stride,
                        tv_slong            width_diff 
                        )
{
    tv_sshort_tables ttl;
 
    __asm{
        push  ebx
        // helper constants
        mov   esi,-14487936
        mov   edi,-5822464
        mov   ecx,-2785792
        mov   edx,-14496256
 
        lea   ebx,DWORD PTR [ttl + 2]
 
        // building helper tables
        ALIGN 4
_tb_loop:
        mov   eax,esi
        sar   eax,16
        mov   WORD PTR [ebx-2],ax
 
        mov   eax,edi
        sar   eax,16
        mov   WORD PTR [ebx+0],ax
 
        mov   eax,ecx
        sar   eax,16
        mov   WORD PTR [ebx+2],ax
 
        mov   eax,edx
        sar   eax,16
        mov   WORD PTR [ebx+4],ax
 
        add   esi,113443
        add   edi,45744
        add   ecx,22020
        add   edx,113508
 
        add   ebx,4 * ( TYPE tv_sshort )
        cmp   esi,14553472
 
        jl   _tb_loop
 
        pop   ebx
    }
 
    lp_tv_uchar line1 = argb_plane;
    lp_tv_uchar line2 = line1 + 4 * argb_width;
 
    lp_tv_uchar y1 = y_plane;
    lp_tv_uchar y2 = y1 + y_stride;
 
    lp_tv_uchar u = u_plane;
    lp_tv_uchar v = v_plane;
 
    int nTempX;
    int nTempY;
    int nTempX_;
 
    for( nTempY = 0 ; nTempY < argb_height ; nTempY += 2 ){
        for( nTempX = 0 ; nTempX < argb_width ; nTempX += 4 ){
            nTempX_ = nTempX >> 1;
            __asm{
                push ebx       ;
 
                mov  eax,DWORD PTR y1   ; eax = y1
                mov  ebx,DWORD PTR y2   ; ebx = y2
                mov  edi,DWORD PTR v    ; edi = v
 
                add  eax,DWORD PTR nTempX  ; eax = y1 + nTempX
                add  ebx,DWORD PTR nTempX  ; ebx = y2 + nTempX
 
                pxor mm2,mm2      ; mm2 = 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0
 
                add  edi,DWORD PTR nTempX_  ; edi = v + nTempX_
                lea  esi,DWORD PTR ttl   ; esi = ttl
 
                movd mm0,DWORD PTR [eax]   ; mm0 = 0 | 0 | 0 | 0 | nY4 | nY3 | nY2 | nY1
                movd mm1,DWORD PTR [ebx]   ; mm1 = 0 | 0 | 0 | 0 | nY8 | nY7 | nY6 | nY5
 
                movzx edx,DWORD PTR [edi]   ; edx = V1
                movzx ecx,DWORD PTR [edi+1]  ; ecx = V2
 
                punpcklbw mm0,mm2     ; mm0 = nY4 | nY3 | nY2 | nY1
                punpcklbw mm1,mm2     ; mm1 = nY8 | nY7 | nY6 | nY5
 
                pinsrw mm4,WORD PTR [esi+edx*8+0],00000000b ; mm4 = 0 | 0 | 0 | ttl[nV1][0]
                pinsrw mm5,WORD PTR [esi+ecx*8+0],00000000b ; mm5 = 0 | 0 | 0 | ttl[nV2][0]
 
                movq mm3,mm0      ; mm3 = nY4 | nY3 | nY2 | nY1
                mov  edi,DWORD PTR u    ; edi = u
 
                punpckldq mm3,mm1     ; mm3 = nY6 | nY5 | nY2 | nY1
                punpckhdq mm0,mm1     ; mm0 = nY8 | nY7 | nY4 | nY3
 
                pshufw mm4,mm4,00000000b   ; mm4 = ttl[nV1][0] | ttl[nV1][0] | ttl[nV1][0] | ttl[nV1][0]
                pshufw mm5,mm5,00000000b   ; mm5 = ttl[nV2][0] | ttl[nV2][0] | ttl[nV2][0] | ttl[nV2][0]
 
                add  edi,DWORD PTR nTempX_  ; edi = u + nTempX_
 
                paddsw mm4,mm3      ; mm4 = P6.R | P5.R | P2.R | P1.R
                paddsw mm5,mm0      ; mm5 = P8.R | P7.R | P4.R | P3.R
 
                pinsrw mm1,WORD PTR [esi+edx*8+2],00000000b ; mm1 = 0 | 0 | 0 | ttl[nV1][1]
                pinsrw mm2,WORD PTR [esi+ecx*8+2],00000000b ; mm2 = 0 | 0 | 0 | ttl[nV2][1]
 
                movq mm6,mm3      ; mm6 = nY6 | nY5 | nY2 | nY1
                movq mm7,mm0      ; mm7 = nY8 | nY7 | nY4 | nY3
 
                movzx edx,DWORD PTR [edi]   ; edx = U1
                movzx ecx,DWORD PTR [edi+1]  ; ecx = U2
 
                pshufw mm1,mm1,00000000b   ; mm1 = ttl[nV1][1] | ttl[nV1][1] | ttl[nV1][1] | ttl[nV1][1]
                pshufw mm2,mm2,00000000b   ; mm2 = ttl[nV2][1] | ttl[nV2][1] | ttl[nV2][1] | ttl[nV2][1]
 
                psubsw mm6,mm1      ; mm6 = nY6 - ttl[nV1][1] | nY5 - ttl[nV1][1] | nY2 - ttl[nV1][1] | nY1 - ttl[nV1][1]
                psubsw mm7,mm2      ; mm7 = nY8 - ttl[nV2][1] | nY7 - ttl[nV2][1] | nY4 - ttl[nV2][1] | nY3 - ttl[nV2][1]
 
                pinsrw mm1,WORD PTR [esi+edx*8+4],00000000b ; mm1 = 0 | 0 | 0 | ttl[nU1][2]
                pinsrw mm2,WORD PTR [esi+ecx*8+4],00000000b ; mm2 = 0 | 0 | 0 | ttl[nU2][2]
 
                pshufw mm1,mm1,00000000b   ; mm1 = ttl[nU1][2] | ttl[nU1][2] | ttl[nU1][2] | ttl[nU1][2]
                pshufw mm2,mm2,00000000b   ; mm2 = ttl[nU2][2] | ttl[nU2][2] | ttl[nU2][2] | ttl[nU2][2]
 
                psubsw mm6,mm1      ; mm6 = P6.G | P5.G | P2.G | P1.G
                psubsw mm7,mm2      ; mm7 = P8.G | P7.G | P4.G | P3.G
 
                pinsrw mm1,WORD PTR [esi+edx*8+6],00000000b ; mm1 = 0 | 0 | 0 | ttl[nU1][3]
                pinsrw mm2,WORD PTR [esi+ecx*8+6],00000000b ; mm2 = 0 | 0 | 0 | ttl[nU2][3]
 
                pshufw mm1,mm1,00000000b   ; mm1 = ttl[nU1][3] | ttl[nU1][3] | ttl[nU1][3] | ttl[nU1][3]
                pshufw mm2,mm2,00000000b   ; mm2 = ttl[nU2][3] | ttl[nU2][3] | ttl[nU2][3] | ttl[nU2][3]
 
                paddsw mm3,mm1      ; mm3 = P6.B | P5.B | P2.B | P1.B
                paddsw mm0,mm2      ; mm0 = P8.B | P7.B | P4.B | P3.B
 
 
                // we have
                ; mm4 = P6.R | P5.R | P2.R | P1.R
                ; mm6 = P6.G | P5.G | P2.G | P1.G
                ; mm3 = P6.B | P5.B | P2.B | P1.B
 
                ; mm5 = P8.R | P7.R | P4.R | P3.R
                ; mm7 = P8.G | P7.G | P4.G | P3.G
                ; mm0 = P8.B | P7.B | P4.B | P3.B
 
                // saturation
                packuswb mm4,mm5 ; mm4 = P8.R | P7.R | P4.R | P3.R | P6.R | P5.R | P2.R | P1.R
                packuswb mm6,mm7 ; mm6 = P8.G | P7.G | P4.G | P3.G | P6.G | P5.G | P2.G | P1.G
                packuswb mm3,mm0 ; mm3 = P8.B | P7.B | P4.B | P3.B | P6.B | P5.B | P2.B | P1.B
 
                // calculating effective store address
                mov  esi,DWORD PTR line1   ; esi = line1
                mov  edi,DWORD PTR line2   ; edi = line2
 
                // we want
                ;px1 = 00 | P2.R | P2.G | P2.B | 00 | P1.R | P1.G | P1.B |
                ;px2 = 00 | P4.R | P4.G | P4.B | 00 | P3.R | P3.G | P3.B |
 
                ;px3 = 00 | P6.R | P6.G | P6.B | 00 | P5.R | P5.G | P5.B |
                ;px4 = 00 | P8.R | P8.G | P8.B | 00 | P7.R | P7.G | P7.B |
 
                // Oh, real sex!
                pcmpeqd mm0,mm0  ; mm0 = 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1
 
                movq mm5,mm6  ; mm5 = P8.G | P7.G | P4.G | P3.G | P6.G | P5.G | P2.G | P1.G
                movq mm7,mm3  ; mm7 = P8.B | P7.B | P4.B | P3.B | P6.B | P5.B | P2.B | P1.B
 
                punpcklbw mm5,mm0 ; mm5 = 0 | P6.G | 0 | P5.G | 0 | P2.G | 0 | P1.G
                punpcklbw mm7,mm4 ; mm7 = P6.R | P6.B | P5.R | P5.B | P2.R | P2.B | P1.R | P1.B
 
                movq  mm1,mm7 ; mm1 = P6.R | P6.B | P5.R | P5.B | P2.R | P2.B | P1.R | P1.B
 
                punpcklbw mm7,mm5 ; mm7 = 0 | P2.R | P2.G | P2.B | 0 | P1.R | P1.G | P1.B 
                // px1
                punpckhbw mm1,mm5 ; mm1 = 0 | P6.R | P6.G | P6.B | 0 | P5.R | P5.G | P5.B 
                // px3
 
                movq  mm2,mm6 ; mm2 = P8.G | P7.G | P4.G | P3.G | P6.G | P5.G | P2.G | P1.G
                movq  mm5,mm3 ; mm5 = P8.B | P7.B | P4.B | P3.B | P6.B | P5.B | P2.B | P1.B
 
                punpckhbw mm2,mm0 ; mm2 = 0 | P8.G | 0 | P7.G | 0 | P4.G | 0 | P3.G
                punpckhbw mm5,mm4 ; mm5 = P8.R | P8.B | P7.R | P7.B | P4.R | P4.B | P3.R | P3.B
 
                movq  mm0,mm5 ; mm0 = P8.R | P8.B | P7.R | P7.B | P4.R | P4.B | P3.R | P3.B
 
                punpckhbw mm5,mm2 ; mm5 = 0 | P8.R | P8.G | P8.B | 0 | P7.R | P7.G | P7.B 
                // px4
                punpcklbw mm0,mm2 ; mm0 = 0 | P4.R | P4.G | P4.B | 0 | P3.R | P3.G | P3.B 
                // px2
 
                // storing using non-temporal hint
                movntq  MMWORD PTR [esi+0],mm7 ;
                movntq  MMWORD PTR [esi+8],mm0 ;
 
                movntq  MMWORD PTR [edi+0],mm1 ;
                movntq  MMWORD PTR [edi+8],mm5 ;
 
                // we are the champions
                pop  ebx       ;
            }
 
            line1 += 16;
            line2 += 16;
        }
 
        y1 += 2 * y_stride;
        y2 = y1 + y_stride;
 
        u += uv_stride;
        v += uv_stride;
 
        line1 += 4 * argb_width;
        line2 = line1 + 4 * argb_width;
    }
 
    __asm{
        sfence        ;
        emms        ;
    }
 
    return argb_plane;
} // tv_yuv2argb
 
#pragma warning( default : 4731 )
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
26.01.2016, 03:36
Здравствуйте! Я подобрал для вас темы с ответами на вопрос Переписать код из ASM на С++ для сборки под x64 (C++):

Inline asm под таргет x64 - Visual C++
Начал осваивать Visual C++. Столкнулся с неадекватной реакцией компилятора MSVC 2013 на директиву __asm под таргет x64 - ошибка: ключевое...

GetAsyncKeyState - переписать код под другую клавишу - C++ WinAPI
Доброе время суток. Ребята, вот я набрал такой код... #include &lt;iostream&gt; #include &lt;windows.h&gt; #include &lt;conio.h&gt; int...

Переписать код суммы ряда под иной ряд - C++
здравствуйте, и снова обращаюсь к вам за помощь. любимый форум, так как больше не к кому.. есть код: #include &quot;stdafx.h&quot; ...

Где взять и как подцепить к Code Blocks бесплатный компилятор x64 стандарта C++11 для Windows 7 x64? - C++
Где взять и как подцепить к Code Blocks бесплатный компилятор x64 стандарта C++11 для Windows 7 x64?

линукс код переписать под вендус. - C++ Linux
Ребят, в общем такая ситуация...код написан под Unix, как его перевести по Windows??? Помогите кто чем может, пожалуйста, иначе мне...

Переписать ASM код на C++ для x64 сборки приложения - Assembler
Всем привет. т.к. я нубик в ASM, прошу помочь мне переписать ASM код на C++ (Мне нужно это для x64 сборки приложения) Вот сам код ...

1
Nummerok
19 / 19 / 2
Регистрация: 30.05.2014
Сообщений: 431
26.01.2016, 04:35  [ТС] #2
даже точнее так:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
#include "stdafx.h"
 
#include "xrTheora_Surface_mmx.h"
 
#pragma warning( disable : 4731 )
 
#pragma pack( push )
#pragma pack( 1 )
 
typedef tv_sshort tv_sshort_tables[ 256 ][ 4 ];
 
#pragma pack( pop )
/*
 
//. width_diff = surface_width - theora_width
 
        u32 pos = 0;
        for (u32 h=0; h<height; ++h){
 
            u8* Y       = yuv.y+yuv.y_stride*h;
            u8* U       = yuv.u+yuv.uv_stride*(h/uv_h);
            u8* V       = yuv.v+yuv.uv_stride*(h/uv_h);
 
            for (u32 w=0; w<width; ++w){
 
                u8 y    = Y[w];
                u8 u    = U[w/uv_w];
                u8 v    = V[w/uv_w];
 
                int C   = y - 16;
                int D   = u - 128;
                int E   = v - 128;
 
                int R   = clampr(( 298 * C           + 409 * E + 128) >> 8,0,255);
                int G   = clampr(( 298 * C - 100 * D - 208 * E + 128) >> 8,0,255);
                int B   = clampr(( 298 * C + 516 * D           + 128) >> 8,0,255);
 
                data[++pos] = color_rgba(R,G,B,255);
 
                if(w==(width-1))
                    pos += width_diff;
            }
        }
*/
 
lp_tv_uchar tv_yuv2argb(
                        lp_tv_uchar         argb_plane ,
                        tv_slong            argb_width ,
                        tv_slong            argb_height ,
                        lp_tv_uchar         y_plane ,
                        tv_slong            y_width ,
                        tv_slong            y_height ,
                        tv_slong            y_stride ,
                        lp_tv_uchar         u_plane ,
                        lp_tv_uchar         v_plane ,
                        tv_slong            uv_width ,
                        tv_slong            uv_height ,
                        tv_slong            uv_stride,
                        tv_slong            width_diff 
                        )
{
    tv_sshort_tables ttl;
#if ENVIRONMENT32
    __asm{
        push  ebx
        // helper constants
        mov   esi,-14487936
        mov   edi,-5822464
        mov   ecx,-2785792
        mov   edx,-14496256
 
        lea   ebx,DWORD PTR [ttl + 2]
 
        // building helper tables
        ALIGN 4
_tb_loop:
        mov   eax,esi
        sar   eax,16
        mov   WORD PTR [ebx-2],ax
 
        mov   eax,edi
        sar   eax,16
        mov   WORD PTR [ebx+0],ax
 
        mov   eax,ecx
        sar   eax,16
        mov   WORD PTR [ebx+2],ax
 
        mov   eax,edx
        sar   eax,16
        mov   WORD PTR [ebx+4],ax
 
        add   esi,113443
        add   edi,45744
        add   ecx,22020
        add   edx,113508
 
        add   ebx,4 * ( TYPE tv_sshort )
        cmp   esi,14553472
 
        jl   _tb_loop
 
        pop   ebx
    }
 
    lp_tv_uchar line1 = argb_plane;
    lp_tv_uchar line2 = line1 + 4 * argb_width;
 
    lp_tv_uchar y1 = y_plane;
    lp_tv_uchar y2 = y1 + y_stride;
 
    lp_tv_uchar u = u_plane;
    lp_tv_uchar v = v_plane;
 
    int nTempX;
    int nTempY;
    int nTempX_;
 
    for( nTempY = 0 ; nTempY < argb_height ; nTempY += 2 ){
        for( nTempX = 0 ; nTempX < argb_width ; nTempX += 4 ){
            nTempX_ = nTempX >> 1;
            __asm{
                push ebx       ;
 
                mov  eax,DWORD PTR y1   ; eax = y1
                mov  ebx,DWORD PTR y2   ; ebx = y2
                mov  edi,DWORD PTR v    ; edi = v
 
                add  eax,DWORD PTR nTempX  ; eax = y1 + nTempX
                add  ebx,DWORD PTR nTempX  ; ebx = y2 + nTempX
 
                pxor mm2,mm2      ; mm2 = 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0
 
                add  edi,DWORD PTR nTempX_  ; edi = v + nTempX_
                lea  esi,DWORD PTR ttl   ; esi = ttl
 
                movd mm0,DWORD PTR [eax]   ; mm0 = 0 | 0 | 0 | 0 | nY4 | nY3 | nY2 | nY1
                movd mm1,DWORD PTR [ebx]   ; mm1 = 0 | 0 | 0 | 0 | nY8 | nY7 | nY6 | nY5
 
                movzx edx,DWORD PTR [edi]   ; edx = V1
                movzx ecx,DWORD PTR [edi+1]  ; ecx = V2
 
                punpcklbw mm0,mm2     ; mm0 = nY4 | nY3 | nY2 | nY1
                punpcklbw mm1,mm2     ; mm1 = nY8 | nY7 | nY6 | nY5
 
                pinsrw mm4,WORD PTR [esi+edx*8+0],00000000b ; mm4 = 0 | 0 | 0 | ttl[nV1][0]
                pinsrw mm5,WORD PTR [esi+ecx*8+0],00000000b ; mm5 = 0 | 0 | 0 | ttl[nV2][0]
 
                movq mm3,mm0      ; mm3 = nY4 | nY3 | nY2 | nY1
                mov  edi,DWORD PTR u    ; edi = u
 
                punpckldq mm3,mm1     ; mm3 = nY6 | nY5 | nY2 | nY1
                punpckhdq mm0,mm1     ; mm0 = nY8 | nY7 | nY4 | nY3
 
                pshufw mm4,mm4,00000000b   ; mm4 = ttl[nV1][0] | ttl[nV1][0] | ttl[nV1][0] | ttl[nV1][0]
                pshufw mm5,mm5,00000000b   ; mm5 = ttl[nV2][0] | ttl[nV2][0] | ttl[nV2][0] | ttl[nV2][0]
 
                add  edi,DWORD PTR nTempX_  ; edi = u + nTempX_
 
                paddsw mm4,mm3      ; mm4 = P6.R | P5.R | P2.R | P1.R
                paddsw mm5,mm0      ; mm5 = P8.R | P7.R | P4.R | P3.R
 
                pinsrw mm1,WORD PTR [esi+edx*8+2],00000000b ; mm1 = 0 | 0 | 0 | ttl[nV1][1]
                pinsrw mm2,WORD PTR [esi+ecx*8+2],00000000b ; mm2 = 0 | 0 | 0 | ttl[nV2][1]
 
                movq mm6,mm3      ; mm6 = nY6 | nY5 | nY2 | nY1
                movq mm7,mm0      ; mm7 = nY8 | nY7 | nY4 | nY3
 
                movzx edx,DWORD PTR [edi]   ; edx = U1
                movzx ecx,DWORD PTR [edi+1]  ; ecx = U2
 
                pshufw mm1,mm1,00000000b   ; mm1 = ttl[nV1][1] | ttl[nV1][1] | ttl[nV1][1] | ttl[nV1][1]
                pshufw mm2,mm2,00000000b   ; mm2 = ttl[nV2][1] | ttl[nV2][1] | ttl[nV2][1] | ttl[nV2][1]
 
                psubsw mm6,mm1      ; mm6 = nY6 - ttl[nV1][1] | nY5 - ttl[nV1][1] | nY2 - ttl[nV1][1] | nY1 - ttl[nV1][1]
                psubsw mm7,mm2      ; mm7 = nY8 - ttl[nV2][1] | nY7 - ttl[nV2][1] | nY4 - ttl[nV2][1] | nY3 - ttl[nV2][1]
 
                pinsrw mm1,WORD PTR [esi+edx*8+4],00000000b ; mm1 = 0 | 0 | 0 | ttl[nU1][2]
                pinsrw mm2,WORD PTR [esi+ecx*8+4],00000000b ; mm2 = 0 | 0 | 0 | ttl[nU2][2]
 
                pshufw mm1,mm1,00000000b   ; mm1 = ttl[nU1][2] | ttl[nU1][2] | ttl[nU1][2] | ttl[nU1][2]
                pshufw mm2,mm2,00000000b   ; mm2 = ttl[nU2][2] | ttl[nU2][2] | ttl[nU2][2] | ttl[nU2][2]
 
                psubsw mm6,mm1      ; mm6 = P6.G | P5.G | P2.G | P1.G
                psubsw mm7,mm2      ; mm7 = P8.G | P7.G | P4.G | P3.G
 
                pinsrw mm1,WORD PTR [esi+edx*8+6],00000000b ; mm1 = 0 | 0 | 0 | ttl[nU1][3]
                pinsrw mm2,WORD PTR [esi+ecx*8+6],00000000b ; mm2 = 0 | 0 | 0 | ttl[nU2][3]
 
                pshufw mm1,mm1,00000000b   ; mm1 = ttl[nU1][3] | ttl[nU1][3] | ttl[nU1][3] | ttl[nU1][3]
                pshufw mm2,mm2,00000000b   ; mm2 = ttl[nU2][3] | ttl[nU2][3] | ttl[nU2][3] | ttl[nU2][3]
 
                paddsw mm3,mm1      ; mm3 = P6.B | P5.B | P2.B | P1.B
                paddsw mm0,mm2      ; mm0 = P8.B | P7.B | P4.B | P3.B
 
 
                // we have
                ; mm4 = P6.R | P5.R | P2.R | P1.R
                ; mm6 = P6.G | P5.G | P2.G | P1.G
                ; mm3 = P6.B | P5.B | P2.B | P1.B
 
                ; mm5 = P8.R | P7.R | P4.R | P3.R
                ; mm7 = P8.G | P7.G | P4.G | P3.G
                ; mm0 = P8.B | P7.B | P4.B | P3.B
 
                // saturation
                packuswb mm4,mm5 ; mm4 = P8.R | P7.R | P4.R | P3.R | P6.R | P5.R | P2.R | P1.R
                packuswb mm6,mm7 ; mm6 = P8.G | P7.G | P4.G | P3.G | P6.G | P5.G | P2.G | P1.G
                packuswb mm3,mm0 ; mm3 = P8.B | P7.B | P4.B | P3.B | P6.B | P5.B | P2.B | P1.B
 
                // calculating effective store address
                mov  esi,DWORD PTR line1   ; esi = line1
                mov  edi,DWORD PTR line2   ; edi = line2
 
                // we want
                ;px1 = 00 | P2.R | P2.G | P2.B | 00 | P1.R | P1.G | P1.B |
                ;px2 = 00 | P4.R | P4.G | P4.B | 00 | P3.R | P3.G | P3.B |
 
                ;px3 = 00 | P6.R | P6.G | P6.B | 00 | P5.R | P5.G | P5.B |
                ;px4 = 00 | P8.R | P8.G | P8.B | 00 | P7.R | P7.G | P7.B |
 
                // Oh, real sex!
                pcmpeqd mm0,mm0  ; mm0 = 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1
 
                movq mm5,mm6  ; mm5 = P8.G | P7.G | P4.G | P3.G | P6.G | P5.G | P2.G | P1.G
                movq mm7,mm3  ; mm7 = P8.B | P7.B | P4.B | P3.B | P6.B | P5.B | P2.B | P1.B
 
                punpcklbw mm5,mm0 ; mm5 = 0 | P6.G | 0 | P5.G | 0 | P2.G | 0 | P1.G
                punpcklbw mm7,mm4 ; mm7 = P6.R | P6.B | P5.R | P5.B | P2.R | P2.B | P1.R | P1.B
 
                movq  mm1,mm7 ; mm1 = P6.R | P6.B | P5.R | P5.B | P2.R | P2.B | P1.R | P1.B
 
                punpcklbw mm7,mm5 ; mm7 = 0 | P2.R | P2.G | P2.B | 0 | P1.R | P1.G | P1.B 
                // px1
                punpckhbw mm1,mm5 ; mm1 = 0 | P6.R | P6.G | P6.B | 0 | P5.R | P5.G | P5.B 
                // px3
 
                movq  mm2,mm6 ; mm2 = P8.G | P7.G | P4.G | P3.G | P6.G | P5.G | P2.G | P1.G
                movq  mm5,mm3 ; mm5 = P8.B | P7.B | P4.B | P3.B | P6.B | P5.B | P2.B | P1.B
 
                punpckhbw mm2,mm0 ; mm2 = 0 | P8.G | 0 | P7.G | 0 | P4.G | 0 | P3.G
                punpckhbw mm5,mm4 ; mm5 = P8.R | P8.B | P7.R | P7.B | P4.R | P4.B | P3.R | P3.B
 
                movq  mm0,mm5 ; mm0 = P8.R | P8.B | P7.R | P7.B | P4.R | P4.B | P3.R | P3.B
 
                punpckhbw mm5,mm2 ; mm5 = 0 | P8.R | P8.G | P8.B | 0 | P7.R | P7.G | P7.B 
                // px4
                punpcklbw mm0,mm2 ; mm0 = 0 | P4.R | P4.G | P4.B | 0 | P3.R | P3.G | P3.B 
                // px2
 
                // storing using non-temporal hint
                movntq  MMWORD PTR [esi+0],mm7 ;
                movntq  MMWORD PTR [esi+8],mm0 ;
 
                movntq  MMWORD PTR [edi+0],mm1 ;
                movntq  MMWORD PTR [edi+8],mm5 ;
 
                // we are the champions
                pop  ebx       ;
            }
 
            line1 += 16;
            line2 += 16;
        }
 
        y1 += 2 * y_stride;
        y2 = y1 + y_stride;
 
        u += uv_stride;
        v += uv_stride;
 
        line1 += 4 * argb_width;
        line2 = line1 + 4 * argb_width;
    }
    __asm{
        sfence        ;
        emms        ;
    }
#else
 
#error C++ CODE
 
#endif
 
    return argb_plane;
} // tv_yuv2argb
 
#pragma warning( default : 4731 )
где директива #error , там надо C++ код.

Помогите кто может, ибо я ASM знаю на базовом уровне

Добавлено через 49 минут
если поможете, то там ещё у меня есть пару cpp файлов где надо переделать ASM вставки на C++ код.
0
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
26.01.2016, 04:35
Привет! Вот еще темы с ответами:

Переписать C++ код на ASM - FASM
Здравствуйте. Есть код бегущей строки на С++. Помогите, пожалуйста, переписать на ассемблер, если начинать код с format PE console 4.0...

Переписать драйвер usb midi контроллера под x64 - Программирование драйверов
Пробовал переписать сам в результате выдает сообщение которое вложено в картинку снизу ; Installation inf for the CASIO USB MIDI device...

Переписать программу с ASM на C для PIC - Микроконтроллеры
Имеется исходник для pic18 на ASM(с комментариями) нужно нарисовать блок схему алгоритма и переписать программу на Си. Все вопросы и...

Переписать код с С++ под FPC - Free Pascal
Здравствуйте. Есть код, написанный на С++, Visual. Помогите, пожалуйста, переписать его под FPC. Считать время выполнения не нужно. ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru