|
15 / 12 / 3
Регистрация: 25.10.2018
Сообщений: 113
|
|
Ассемблерная вставка с AVX-инструкциями02.05.2019, 18:07. Показов 2027. Ответов 7
Метки нет (Все метки)
Здравствуйте, я бы хотел обрабатывать числа большой длины, и хотел бы написать свои функции на ЯВУ, которые работают быстро, я бы хотел обрабатывать всё напрямую в регистрах, например числа брать из файла, грузить допустим значения по 512 бит в векторные регистры и складывать их. Только вот не знаю ничего. Литературы по AVX не нашёл, мне бы хотя бы табличку с инструкциями с тем что они делают, похожую например на систему команд для 32-разрядного процессора 80386.
0
|
|
| 02.05.2019, 18:07 | |
|
Ответы с готовыми решениями:
7
Ассемблерная вставка Ассемблерная вставка в С++ Ассемблерная вставка, одномерный масив. |
|
15 / 12 / 3
Регистрация: 25.10.2018
Сообщений: 113
|
||||||
| 02.05.2019, 18:45 [ТС] | ||||||
|
Вот, что я только что сумел реализовать (сложение двух 256-битных чисел), но не думаю, что это совсем верно
0
|
||||||
|
2630 / 1642 / 266
Регистрация: 19.02.2010
Сообщений: 4,361
|
|||
| 04.05.2019, 22:53 | |||
![]() 128битный SSE вполне себе нормально работал на 32битных пеньках3, под 32битными Вин2000/ВинХР. И до сих пор может жить в 32битных прогах независимо от разрядности (32 или 64) современного процессора. У 64битных процессоров просто выросло в 2 раза число доступных SSE-регистров (увеличилось с 8 до 16). ЕМНИП, аналогично и для AVX - в 32разрядных прогах оно возможно, но видит только 8 регистров. SSE и AVX/AVX512 позволяют работать ТОЛЬКО со СТАНДАРТНЫМИ типами целых и плавучих данных. Т.е. 32 и 64разрядные плавучие, и 8/16/32/64разрядные целые. В длинный (128/256/512бит) регистр грузится либо одно такое число (в младшие биты), либо несколько (на всю ширину регистра). Арифм.операции, соответственно, работают с лежащими в таком регистре числами ПО-ОТДЕЛЬНОСТИ. Т.е. если при выполнении команды сложения целых в младшем 32битном целом (если складываем 32разрядные целые) возникло переполнение - то оно в следующие биты НЕ ПЕРЕНОСИТСЯ, а обрабатывается по правилам работы с 32разрядным целым. Аналогично и для всех остальных компонент регистра - результат ограничен битностью данных, а не всего регистра. Т.е. нет 128/256/512разрядной арифметики - SIMD-команды не для этого сделаны.
0
|
|||
|
2630 / 1642 / 266
Регистрация: 19.02.2010
Сообщений: 4,361
|
||||
| 05.05.2019, 20:47 | ||||
|
А SSE вполне себе существовал во времена 32разрядных процессоров и 32разрядных ОС. И Интел это сделал не для того, чтобы оно просто было в процессорах незадействованным - а чтобы народ=программисты (ну, и компиляторы, которые поумнее) это юзал. Не требуя при этом обязательности перехода к 64разрядным прогам/ОС/процессорам.
0
|
||||
|
15 / 12 / 3
Регистрация: 25.10.2018
Сообщений: 113
|
||
| 13.05.2019, 15:28 [ТС] | ||
0
|
||
|
15 / 12 / 3
Регистрация: 25.10.2018
Сообщений: 113
|
||
| 14.05.2019, 03:24 [ТС] | ||
0
|
||
| 14.05.2019, 03:24 | |
|
Помогаю со студенческими работами здесь
8
Ассемблерная вставка в с++ Ассемблерная вставка Ассемблерная вставка на С++
Ассемблерная вставка в С++ Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога
SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
|
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL3_image
8Observer8 27.01.2026
Содержание блога
SDL3_image - это библиотека для загрузки и работы с изображениями. Эта пошаговая инструкция покажет, как загрузить и вывести на экран смартфона картинку с альфа-каналом, то есть с. . .
|
влияние грибов на сукцессию
anaschu 26.01.2026
Бифуркационные изменения массы гриба происходят тогда, когда мы уменьшаем массу компоста в 10 раз, а скорость прироста биомассы уменьшаем в три раза. Скорость прироста биомассы может уменьшаться за. . .
|
Воспроизведение звукового файла с помощью SDL3_mixer при касании экрана Android
8Observer8 26.01.2026
Содержание блога
SDL3_mixer - это библиотека я для воспроизведения аудио. В отличие от инструкции по добавлению текста код по проигрыванию звука уже содержится в шаблоне примера. Нужно только. . .
|
|
Установка Android SDK, NDK, JDK, CMake и т.д.
8Observer8 25.01.2026
Содержание блога
Перейдите по ссылке: https:/ / developer. android. com/ studio и в самом низу страницы кликните по архиву "commandlinetools-win-xxxxxx_latest. zip"
Извлеките архив и вы увидите. . .
|
Вывод текста со шрифтом TTF на Android с помощью библиотеки SDL3_ttf
8Observer8 25.01.2026
Содержание блога
Если у вас не установлены Android SDK, NDK, JDK, и т. д. то сделайте это по следующей инструкции: Установка Android SDK, NDK, JDK, CMake и т. д.
Сборка примера
Скачайте. . .
|
Использование SDL3-callbacks вместо функции main() на Android, Desktop и WebAssembly
8Observer8 24.01.2026
Содержание блога
Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
|
моя боль
iceja 24.01.2026
Выложила интерполяцию кубическими сплайнами www. iceja. net
REST сервисы временно не работают, только через Web.
Написала за 56 рабочих часов этот сайт с нуля. При помощи perplexity. ai PRO , при. . .
|