|
2 / 2 / 0
Регистрация: 18.09.2021
Сообщений: 418
|
||||||
Оптимизация алгоритма Гаусса30.11.2023, 15:04. Показов 2471. Ответов 11
Метки нет (Все метки)
можно ли оптимизировать данный код еще лучше, используя SIMD-инструкции?
1
|
||||||
| 30.11.2023, 15:04 | |
|
Ответы с готовыми решениями:
11
Оптимизация алгоритма Хаффмана
Оптимизация алгоритма |
|
2637 / 1648 / 267
Регистрация: 19.02.2010
Сообщений: 4,368
|
|
| 30.11.2023, 15:34 | |
|
Матрица 3*3? Смешно.
1000*1000 хотя-бы возьми - там даже скалярный (т.е. без векторизации компилятором/вручную) сишный код должен не дольше чем за пару секунд отрабатывать.
0
|
|
|
2 / 2 / 0
Регистрация: 18.09.2021
Сообщений: 418
|
||||||
| 30.11.2023, 17:04 [ТС] | ||||||
|
VTsaregorodtsev, сделал 1000*1000
теперь возникает такая ошибка. код теперь такой:
0
|
||||||
|
2637 / 1648 / 267
Регистрация: 19.02.2010
Сообщений: 4,368
|
||
| 30.11.2023, 18:06 | ||
|
Одну ошибку я нашёл - дальше другие возможные ошибки мне лень искать.
0
|
||
|
2 / 2 / 0
Регистрация: 18.09.2021
Сообщений: 418
|
|
| 30.11.2023, 22:05 [ТС] | |
|
VTsaregorodtsev, а как тогда цикл должен выглядеть?
0
|
|
|
267 / 199 / 30
Регистрация: 26.11.2022
Сообщений: 866
|
|
| 01.12.2023, 01:45 | |
|
volver, прежде чем что-то оптимизировать надо выяснить на что тратится время.
То что вы поставили пару simd инструкций не значит что стало быстрее. Вы проверили что генерирует компилятор если просто на С написать код ? со всеми оптимизациями. соответственно запустите дизассемблер и сравните. Вы проверили последовательность обращения к памяти - для наилучшего использования кэша ? замеры производительности надо производить после первого прогона - когда всё уже в кеше и на временной базе когда погрешность измерения времени хотябы в 1000 раз меньше измеряемой величины. но тогда от 30, 40-45 строки надо избавиться - иначе вы будете замерять ещё и выделение памяти и вывод на экран ))
0
|
|
|
524 / 512 / 129
Регистрация: 31.10.2016
Сообщений: 4,156
|
|
| 01.12.2023, 02:52 | |
|
volver, Вы запрограммировали неустойчивый алгоритм, если на очередном шаге случится так, что A[i][i]==0,
то он потерпит неудачу, если же A[i][i] будет равно очень малому числу, то будет потеряна вся точность и решение будет неадекватным (этот вариант даже хуже, так как его можно вовремя и не обнаружить). Ну и обратный проход, который Вы оптимизируете, занимает намного меньше вычислительных затрат, чем прямой проход.
1
|
|
|
2 / 2 / 0
Регистрация: 18.09.2021
Сообщений: 418
|
||||||
| 01.12.2023, 03:16 [ТС] | ||||||
|
Alexis333, если я хочу оптимизировать этот алгоритм с помощью SIMD-инструкций, что лучше сделать, чтобы не терять точность?
Добавлено через 6 минут Alexis333, я сейчас добавил такие строки:
Добавлено через 14 минут Alexis333, прошу прощения, но есть еще один вопрос: я попробовал запустить на линуксе, и "оптимизированный" алгоритм работает примерно в 2 раза дольше ![]() не знаете, в чем может быть проблема? Добавлено через 14 секунд Alexis333, прошу прощения, но есть еще один вопрос: я попробовал запустить на линуксе, и "оптимизированный" алгоритм работает примерно в 2 раза дольше ![]() не знаете, в чем может быть проблема?
0
|
||||||
|
524 / 512 / 129
Регистрация: 31.10.2016
Сообщений: 4,156
|
|||
| 01.12.2023, 04:34 | |||
|
Но я писал о потере точности связанной не с разрядностью, а со свойствами самой матрицы. Лучше добавить в алгоритм выбор ведущего элемента, иначе он будет неустойчивым, то будет давать нормальную точность, то очень низкую. Ещё один вариант - использовать SIMD для получения приближенного решения, которое потом уточнить с помощью нескольких простой итераций. Вычислительная сложность алгоритма Гаусса, на сколько я помню 3n^3 сложений-умножений, а простой итерации - всего n^2 сложений-умножений. Так можно сразу повысить и точность и производительность.
0
|
|||
|
2 / 2 / 0
Регистрация: 18.09.2021
Сообщений: 418
|
|
| 01.12.2023, 04:38 [ТС] | |
|
Alexis333, в общем simd инструкции не дали мне никакого увеличения в оптимизации. я попробовал использовать встроенную библиотеку OpenMP, так стало лучше. хотело бы конечно самому это оптимизировать, но что-то безрезультативно
0
|
|
|
524 / 512 / 129
Регистрация: 31.10.2016
Сообщений: 4,156
|
|
| 01.12.2023, 05:25 | |
|
volver, попробуйте использовать библиотеки blas
0
|
|
|
|
|||||||
| 10.12.2023, 15:13 | |||||||
1
|
|||||||
| 10.12.2023, 15:13 | |
|
Помогаю со студенческими работами здесь
12
Оптимизация алгоритма Оптимизация алгоритма Оптимизация алгоритма
Оптимизация алгоритма быстрого поиска Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
SDL3 для Web (WebAssembly): сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога
Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
|
Установка Emscripten SDK (emsdk) и CMake на Windows для сборки C и C++ приложений в WebAssembly (Wasm)
8Observer8 30.01.2026
Чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. Система контроля версиями Git. . .
|
Подключение Box2D v3 к SDL3 для Android: физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
|
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования.
Часть библиотеки BedvitCOM
Использованы. . .
|
|
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога
SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
|
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL3_image
8Observer8 27.01.2026
Содержание блога
SDL3_image - это библиотека для загрузки и работы с изображениями. Эта пошаговая инструкция покажет, как загрузить и вывести на экран смартфона картинку с альфа-каналом, то есть с. . .
|
Влияние грибов на сукцессию
anaschu 26.01.2026
Бифуркационные изменения массы гриба происходят тогда, когда мы уменьшаем массу компоста в 10 раз, а скорость прироста биомассы уменьшаем в три раза. Скорость прироста биомассы может уменьшаться за. . .
|
Воспроизведение звукового файла с помощью SDL3_mixer при касании экрана Android
8Observer8 26.01.2026
Содержание блога
SDL3_mixer - это библиотека я для воспроизведения аудио. В отличие от инструкции по добавлению текста код по проигрыванию звука уже содержится в шаблоне примера. Нужно только. . .
|