Ассемблерная вставка с AVX-инструкциями

@PeterVl · Регистрация: 25.10.2018

Студворк — интернет-сервис помощи студентам

Здравствуйте, я бы хотел обрабатывать числа большой длины, и хотел бы написать свои функции на ЯВУ, которые работают быстро, я бы хотел обрабатывать всё напрямую в регистрах, например числа брать из файла, грузить допустим значения по 512 бит в векторные регистры и складывать их. Только вот не знаю ничего. Литературы по AVX не нашёл, мне бы хотя бы табличку с инструкциями с тем что они делают, похожую например на систему команд для 32-разрядного процессора 80386.

@PeterVl · 02.05.2019, 18:45 **[ТС]**

Вот, что я только что сумел реализовать (сложение двух 256-битных чисел), но не думаю, что это совсем верно

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
#include<iostream>
#include<windows.h>
using namespace std;
int main() {
    SetConsoleCP(1251);
    SetConsoleOutputCP(1251);
    system("cls");
    int b[8] = { 1, 1, 1, 1, 1, 1, 1, 1 };  // = 0000 0001 0000 0001 0000 0001 0000 0001 0000 0001 0000 0001 0000 0001 0000 0001 (in hex)
    for (int i = 0; i < 8; i++)
    {
        cout <<hex<< b[i] << " ";
    }
    _asm
    {
        vmovupd ymm0, [b]
        vaddpd ymm0, ymm0, ymm0;            // Насколько я понял ymm0 = ymm0 + ymm0
        vmovupd [b], ymm0
    }
    cout << endl;
    for (int i = 0; i < 8; i++)
    {
        cout <<hex<< b[i] <<" ";
    }
    system("pause");
    return 0;
}
 
}

@_lunar_ · 04.05.2019, 20:34

Сообщение от PeterVl

но не думаю, что это совсем верно

естественно это не верно
__asm работает только на 32 битном компиляторе.
чтобы использовать 128 битные и больше регистры, ваше приложение изначально должно быть 64 битным.

Сообщение от PeterVl

Литературы по AVX не нашёл

доки интела, или туторы на ютубе

@VTsaregorodtsev · 04.05.2019, 22:53

Сообщение от _lunar_

чтобы использовать 128 битные и больше регистры, ваше приложение изначально должно быть 64 битным.

128битный SSE вполне себе нормально работал на 32битных пеньках3, под 32битными Вин2000/ВинХР.
И до сих пор может жить в 32битных прогах независимо от разрядности (32 или 64) современного процессора.
У 64битных процессоров просто выросло в 2 раза число доступных SSE-регистров (увеличилось с 8 до 16).
ЕМНИП, аналогично и для AVX - в 32разрядных прогах оно возможно, но видит только 8 регистров.

Сообщение от PeterVl

но не думаю, что это совсем верно

Совершенно неверно.
SSE и AVX/AVX512 позволяют работать ТОЛЬКО со СТАНДАРТНЫМИ типами целых и плавучих данных. Т.е. 32 и 64разрядные плавучие, и 8/16/32/64разрядные целые.
В длинный (128/256/512бит) регистр грузится либо одно такое число (в младшие биты), либо несколько (на всю ширину регистра).
Арифм.операции, соответственно, работают с лежащими в таком регистре числами ПО-ОТДЕЛЬНОСТИ. Т.е. если при выполнении команды сложения целых в младшем 32битном целом (если складываем 32разрядные целые) возникло переполнение - то оно в следующие биты НЕ ПЕРЕНОСИТСЯ, а обрабатывается по правилам работы с 32разрядным целым. Аналогично и для всех остальных компонент регистра - результат ограничен битностью данных, а не всего регистра.
Т.е. нет 128/256/512разрядной арифметики - SIMD-команды не для этого сделаны.

@_lunar_ · 05.05.2019, 09:47

VTsaregorodtsev, причём здесь пеньки и sse? Что за бред вы несёте?
ещё раз прочитайте, что я написал.

в дальнейшую полемику вдаваться не собираюсь..

@VTsaregorodtsev · 05.05.2019, 20:47

Сообщение от _lunar_

причём здесь пеньки и sse?

Интересно, к чему тогда относятся 128бит в этих Ваших словах?

Сообщение от _lunar_

чтобы использовать 128 битные и больше регистры

К каким таким регистрам, кроме как к SSE, а?
А SSE вполне себе существовал во времена 32разрядных процессоров и 32разрядных ОС. И Интел это сделал не для того, чтобы оно просто было в процессорах незадействованным - а чтобы народ=программисты (ну, и компиляторы, которые поумнее) это юзал. Не требуя при этом обязательности перехода к 64разрядным прогам/ОС/процессорам.

Сообщение от _lunar_

в дальнейшую полемику вдаваться не собираюсь..

Спасибо, я всё понял

@PeterVl · 13.05.2019, 15:28 **[ТС]**

Арифм.операции, соответственно, работают с лежащими в таком регистре числами ПО-ОТДЕЛЬНОСТИ. Т.е. если при выполнении команды сложения целых в младшем 32битном целом (если складываем 32разрядные целые) возникло переполнение - то оно в следующие биты НЕ ПЕРЕНОСИТСЯ, а обрабатывается по правилам работы с 32разрядным целым. Аналогично и для всех остальных компонент регистра - результат ограничен битностью данных, а не всего регистра.
Т.е. нет 128/256/512разрядной арифметики - SIMD-команды не для этого сделаны.

Я в этом уже убедился, когда пытался отладить это большими числами. Но я по-прежнему ищу какой-нибудь способ посчитать большие числа

@PeterVl · 14.05.2019, 03:24 **[ТС]**

доки интела, или туторы на ютубе

Спасибо за информацию. Буду тщательно изучать и, может быть, найду ответы на свои вопросы.

Новые блоги и статьи Все статьи Все блоги /
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL_LoadPNG (без SDL3_image) 8Observer8 28.01.2026 Содержание блога SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .	Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL3_image 8Observer8 27.01.2026 Содержание блога SDL3_image - это библиотека для загрузки и работы с изображениями. Эта пошаговая инструкция покажет, как загрузить и вывести на экран смартфона картинку с альфа-каналом, то есть с. . .	влияние грибов на сукцессию anaschu 26.01.2026 Бифуркационные изменения массы гриба происходят тогда, когда мы уменьшаем массу компоста в 10 раз, а скорость прироста биомассы уменьшаем в три раза. Скорость прироста биомассы может уменьшаться за. . .	Воспроизведение звукового файла с помощью SDL3_mixer при касании экрана Android 8Observer8 26.01.2026 Содержание блога SDL3_mixer - это библиотека я для воспроизведения аудио. В отличие от инструкции по добавлению текста код по проигрыванию звука уже содержится в шаблоне примера. Нужно только. . .
Установка Android SDK, NDK, JDK, CMake и т.д. 8Observer8 25.01.2026 Содержание блога Перейдите по ссылке: https:/ / developer. android. com/ studio и в самом низу страницы кликните по архиву "commandlinetools-win-xxxxxx_latest. zip" Извлеките архив и вы увидите. . .	Вывод текста со шрифтом TTF на Android с помощью библиотеки SDL3_ttf 8Observer8 25.01.2026 Содержание блога Если у вас не установлены Android SDK, NDK, JDK, и т. д. то сделайте это по следующей инструкции: Установка Android SDK, NDK, JDK, CMake и т. д. Сборка примера Скачайте. . .	Использование SDL3-callbacks вместо функции main() на Android, Desktop и WebAssembly 8Observer8 24.01.2026 Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .	моя боль iceja 24.01.2026 Выложила интерполяцию кубическими сплайнами www. iceja. net REST сервисы временно не работают, только через Web. Написала за 56 рабочих часов этот сайт с нуля. При помощи perplexity. ai PRO , при. . .

@PeterVl 15 / 12 / 3 Регистрация: 25.10.2018 Сообщений: 113

	Ассемблерная вставка с AVX-инструкциями 02.05.2019, 18:07. Показов 2027. Ответов 7 Метки нет (Все метки) Здравствуйте, я бы хотел обрабатывать числа большой длины, и хотел бы написать свои функции на ЯВУ, которые работают быстро, я бы хотел обрабатывать всё напрямую в регистрах, например числа брать из файла, грузить допустим значения по 512 бит в векторные регистры и складывать их. Только вот не знаю ничего. Литературы по AVX не нашёл, мне бы хотя бы табличку с инструкциями с тем что они делают, похожую например на систему команд для 32-разрядного процессора 80386. 0

@_lunar_ 3701 / 2836 / 451 Регистрация: 03.05.2011 Сообщений: 5,193 Записей в блоге: 21
	05.05.2019, 09:47
	VTsaregorodtsev, причём здесь пеньки и sse? Что за бред вы несёте? ещё раз прочитайте, что я написал. в дальнейшую полемику вдаваться не собираюсь.. 1