|
COM‐пропагандист
|
|
Тест быстроты сгенерированного кода10.05.2021, 18:45. Показов 14999. Ответов 100
Синтетический тест быстроты сгенерированного кода разных компиляторов на основе алгоритма быстрой сортировки.
## Требования 1. Алгоритм быстрой сортировки (сортировка Хоара с разбиением по Хоару). 2. Сортировка по возрастанию: от маленького значения к большему. 3. Посторонние библиотеки для сортировки не использовать. 4. Сортировка в одном потоке. ### Измерения 1. Измеряется время сортировки массива. 2. Десять циклов измерений времени, выводится среднее. ### Данные 1. Длина массива 50000000 (пятьдесят миллионов). 2. Тип данных массива: структура из двух полей типа Double: {LowPart, HighPart}. 3. На каждом цикле массив заполняется случайными значениями в интервале `[0, 1)`. 4. Генератор случайных чисел инициализируется заново перед каждым заполнением массива. 5. Количество рекурсивных вызовов функции сотировки должно быть одинаковым на одном и том же наборе данных. 6. Затравка для генератора случайных чисел равна нулю. 7. Функция сравнения переменных a и b (возможна оптимизация): ``` (a.HighPart < b.HighPart) Or ((a.HighPart = b.HighPart) And (a.LowPart < b.LowPart)) ``` ### Вывод 1. Время выполнения сортировки по каждому циклу. 2. Количество рекурсивных вызовов сортировки (должно быть одинаковым). 3. Среднее время. Для компиляции этой программы необходим gcc (для "-gen gcc" на x86) и mingw (для утилиты mingw32-make). Необходимые пути к компилятору и утилитам указаны в пакетных файлах. В результате: FreeBASIC с задником GCC 5.2.0: среднее время 12080 миллисекунд. FreeBASIC с задником GCC 8.1.0: среднее время 12445 миллисекунд. FreeBASIC с задником GCC 10.2.0: среднее время 10993 миллисекунд. Забавно, что звучащая фоном музыка может замедлять задачу на 1000 миллисекунд. Приглашаю вступить в игру пропагандистам других диалектов бесика.
1
|
|
| 10.05.2021, 18:45 | |
|
Ответы с готовыми решениями:
100
Ошибки сгенерированного кода Выполнение кода, сгенерированного Roslyn Чтение сгенерированного кода в Visual Studio |
|
|
||||
| 11.05.2021, 15:41 | ||||
|
Вы все слишком усложнили. Это не нужно для данной задачи.
0
|
||||
|
COM‐пропагандист
|
|||||||||
| 11.05.2021, 16:30 [ТС] | |||||||||
|
«Количество рекурсивных вызовов функции сортировки» — это нужно чтобы показать, что алгоритм работает одинаково на одном и том же наборе данных.
0
|
|||||||||
|
|
||
| 11.05.2021, 18:00 | ||
|
Я хотел сделать на Пурик, но потом вспомнил, что Пуриковский RND генерирует целые числа, а тут от 0 до 1. Ну и лень мне стало изобретать велосипед. Другое удивило. Скомпилировал код что в архиве в обычном FreeBasic_Build_1.05 х86 из под fbedit в режиме консольного приложения, стандартная поставка, без танцев с бубном. Время сортировки: 19658 Ваша версия из архива : QuickSort_Console_GCC-08.1.0_FBC-1.07.3_WoPTWoRtWoCrWoMingwW - время 8930 Один и тот же код, в моём случае работает почти 20 секунд, а в вашем всего 9 секунд? И размер тоже разный очень, у меня почти 30 кб, у вас около 6 кб. Что за магия? Мой файл, если что:
0
|
||
|
COM‐пропагандист
|
||||||||||
| 11.05.2021, 18:42 [ТС] | ||||||||||
|
По умолчанию на x86 FreeBASIC генерирует код для задника (бекенда) GAS, на x64 — для GCC 5.2.0. Можно дополнительно установить задник GCC 8.1.0, он лучше оптимизирует код, получается быстрее. Добавлено через 5 минут Вот так можно заполнить массив числами с плавающей точкой, если ваш генератор выдаёт только целые числа:
Добавлено через 5 минут
0
|
||||||||||
|
|
||||
| 11.05.2021, 19:43 | ||||
|
1
|
||||
|
COM‐пропагандист
|
||||
| 12.05.2021, 03:22 [ТС] | ||||
|
0
|
||||
|
|
||
| 12.05.2021, 10:03 | ||
|
0
|
||
|
COM‐пропагандист
|
|
| 12.05.2021, 12:33 [ТС] | |
|
Странное решение запрещать оптимизацию только потому, что другие бейсики не умеют оптимизировать код или не отправляют абстрактное синтаксическое дерево в оптимизирующие утилиты.
0
|
|
|
|
|||
| 12.05.2021, 13:43 | |||
|
Или в сравнении участвуют все компиляторы, а не только бейсики?
0
|
|||
|
COM‐пропагандист
|
|
| 12.05.2021, 14:36 [ТС] | |
|
Вы непременно необходимо чтобы оптимизатор сидел в том же исполняемом файле, что и компилятор?
Что делать при компиляции в LLVM? Вся архитектура LLVM построена на генерации передником псевдокода «как есть» без удаления программистского Lorem Ipsum, и отдаче его заднику LLVM, где оптимизацию выполняет набор утилит заднего двора. Вы считаете, что если отдали заднику любой страшный код любого компилятора, то после применения оптимизирующих операций на выходе код будет одинаково причёсанным и одинаково быстрым? Есть ли смысл в 21 веке разрабатывать собственный оптимизатор или проще воспользоваться уже готовыми, разрабатываемыми такими могущественными транснациональными корпорациями, как APPPLE и GUGLE, капитализация которых вдесятеро превышает годовой бюджет Российской Федерации?
0
|
|
|
|
|
| 12.05.2021, 17:18 | |
|
Я уже отвечал на эти вопросы Тест быстроты сгенерированного кода
0
|
|
|
COM‐пропагандист
|
|
| 13.05.2021, 07:44 [ТС] | |
|
Получить программу с -O 3 без оптимизации от GCC нетривиально. Придётся вмешиваться в процесс трансляции, вручную запускать задник с O0, самостоятельно линковать объектные файлы, добавлять main и инициализировать библиотеки времени выполнения.
Без оптимизации на моём компьютере 64‐битная программа выполняется за 26 секунд, 32‐битная — за 30 секунд.
0
|
|
|
COM‐пропагандист
|
|
| 13.05.2021, 09:56 [ТС] | |
|
Смотрю на ассемблерный код функции QuickSort после оптимизатора:
* функция сравнения встроена внутрь сортировки * широко используются регистры * практически нет push и pop * адресация к локальным переменным идёт сразу по rsp * какие‐то выравнивания, видимо процессор быстрее обсчитывает выровненные данные * всего лишь один вызов сортировки QuickSort, в исходном коде два. Добавлено через 33 минуты locm, как в PureBasic принято измерять производительность участка кода с высокой точностью?
0
|
|
|
|
|||||||||||||||||
| 13.05.2021, 11:33 | |||||||||||||||||
Если достаточно разрешающей способности 1 мс. можно использовать функцию из библиотеки.
0
|
|||||||||||||||||
|
|
|||
| 20.05.2021, 08:05 | |||
PureBasic x64 – C Back-end with optimizer enabled (-02) : 298 FPS PureBasic x64 – assembly back-end : 192 FPS Т.О. простое переключение компилятора на С даёт прирост почти на половину ![]() Еще один интересный момент - скорость исполняемого файла бэкэнд C без оптимизации (-O0) также составляла 192 кадра в секунду, как и у сборочной бэкэнд PureBasic. Неплохо для компилятора небольшой команды! Сегодня вышла для теста новая версия PureBasic 6.00 Alpha 1 x64, которую реально можно пощупать руками, потестить, сравнить скорость, оптимизацию, размер и т.п.
1
|
|||
|
COM‐пропагандист
|
||
| 20.05.2021, 08:55 [ТС] | ||
|
GCC = *.c → *.asm → *.o → *.exe FASM = *.asm → *.o → *.exe Четыре всегда больше чем три, как ни крути. Почему GCC, а не LLVM? У LLVM есть достоинства: * поддерживается могущественными транснациональными корпорациями типа Apple и GUGLE * развивается быстрее * промежуточное представление (ll‐код) — это не язык Си, отпадает нужда представлять данные и код в стиле Си * лучше оптимизирует код Говорили ли разработчики причины почему они выбрали GCC, а не LLVM?
0
|
||
|
|
||||
| 20.05.2021, 10:09 | ||||
GCC = *.c → *.o → *.exe потому что нет смысла транслировать в асм, если логичнее сразу в машинные коды.
0
|
||||
|
COM‐пропагандист
|
||||||||
| 20.05.2021, 13:48 [ТС] | ||||||||
|
Я только что переименовал as.exe в _as.exe, и gcc.exe выдал такоэ:
Слышать, что PureBasic не может — это очень странное заявление.
0
|
||||||||
| 20.05.2021, 13:48 | |
|
Помогаю со студенческими работами здесь
20
Как сравнить эффективность сгенерированного кода Си VS2003 VS Pelles C ver.7
C-Extension для быстроты Пайтона
Какие сервисы можно преспокойно выключить для быстроты загрузки? Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога
Финальные проекты на Си и на C++:
hello-sdl3-c. zip
hello-sdl3-cpp. zip
Результат:
|
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога
MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
|
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд.
Даже если у вас. . .
|
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает
монорепозиторий в котором находятся все исходники.
При создании нового решения, мы просто добавляем нужные проекты
и имеем. . .
|
|
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение:
В этой книге («Подход, основанный на вариантах использования») Ивар утверждает,
что архитектура программного обеспечения — это
структуры,. . .
|
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога
Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
|
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога
Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip
На первой гифке отладочные линии отключены, а на второй включены:. . .
|
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога
Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip Сканируйте QR-код на мобильном и вы увидите, что появится джойстик для управления главным героем.
. . .
|