Форум программистов, компьютерный форум, киберфорум
Assembler для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.73/15: Рейтинг темы: голосов - 15, средняя оценка - 4.73
0 / 0 / 0
Регистрация: 06.10.2013
Сообщений: 30

Определение тиков, затраченных на исполнение инструкций

03.11.2016, 19:31. Показов 3013. Ответов 10
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте!
Мне необходимо отладить код и для контроля версий кода мне нужно иметь производительность, достаточно будет измерить количество тактов на некоторый список инструкций в большой файле ассемблера. Как мне это сделать?
P.S. пробовал через RDTSC, но, видимо, VS 2015 параллелит исполнение программы на нескольких ядрах и получается, что в один момент она считывает кол-во тактов с одного, а в другой - с другого. Может даже получиться, что разница отрицательна!
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
03.11.2016, 19:31
Ответы с готовыми решениями:

Определение размеров инструкций процессора
Здравствуйте, я столкнулся с некоторым непониманием (или неуверенностью в понимании) количества памяти, которое команда занимает в ОП. Я...

Вычисление милисекунд, затраченных на цикл
Всем привет. Требуется совет, как реализовать код вычисляющий время затраченное на выполнение тело цикла?

Плагин для визуального анализа затраченных системных ресурсов программы
Существует ли программа/плагин для VS чтобы визуально посмотреть время выполнения каждого элемента программы на С# и затраченное количество...

10
 Аватар для Ol44
197 / 89 / 15
Регистрация: 10.07.2016
Сообщений: 146
03.11.2016, 19:52
Цитата Сообщение от DonkeyKong Посмотреть сообщение
пробовал через RDTSC, но, видимо, VS 2015 параллелит исполнение программы на нескольких ядрах и получается, что в один момент она считывает кол-во тактов с одного, а в другой - с другого. Может даже получиться, что разница отрицательна!
Неправильно реализовали алгоритм подсчёта. RDTSC считывает количество тиков прошедших с ресета и этот счётчик одинаков для всех ядер.
Как вариант:
Assembler
1
2
3
4
5
6
7
8
9
10
11
rdtsc
push edx
push eax
............
............
rdtsc
push edx
push eax
movq mm0,[esp]
psubq mm0,[esp]+8
add esp,16
И в дебагере смотрим, либо делаем какой-то вывод из mm0. Если программа очень большая показатели могут сильно скакать, т.к. возникнут прерывания.
2
0 / 0 / 0
Регистрация: 06.10.2013
Сообщений: 30
03.11.2016, 21:02  [ТС]
Вот такие инструкции выдают очень странную разницу:
Assembler
1
2
3
4
5
6
7
8
9
10
rdtsc
    shl rdx, 32
    xor rax, rdx
    push rax
    rdtsc
    shl rdx, 32
    xor rax, rdx
    push rax
    movq mm0,[rsp]
    psubq mm0,[rsp + 8]
... = EDE64 !
Многовато? Или так и должно быть?
0
 Аватар для Kukuxumushu
1624 / 806 / 146
Регистрация: 13.06.2015
Сообщений: 3,266
03.11.2016, 21:22
DonkeyKong, а что мешает
Assembler
1
2
3
4
5
6
7
8
9
rdtsc
shl rdx, 32
add rax, rdx
mov rbx, rax
................
rdtsc
shl rdx, 32
add rax, rdx
sub rax, rbx
?
2
0 / 0 / 0
Регистрация: 06.10.2013
Сообщений: 30
03.11.2016, 22:02  [ТС]
И это подойдёт, просто тот вариант больше подходил под моё задание
0
 Аватар для Ol44
197 / 89 / 15
Регистрация: 10.07.2016
Сообщений: 146
04.11.2016, 13:01
Цитата Сообщение от DonkeyKong Посмотреть сообщение
EDE64 ! Многовато? Или так и должно быть?
Это под миллион тактов, много или мало тебе лучше знать свою программу. Если к примеру частота проца 3ГГц это 3 млр. тактов в секунду и из них 1 млн. это 1/3000. К примеру у меня на ноуте замеры очень зависят от плана электропитания: "экономия энергии" медленнее в 2 раза "сбалансированный", который в свою очередь в полтора раза медленней "высокая производительность" на котором стоят максимально возможные для всех ядер частоты на постоянной основе, что даёт более стабильные замеры, т.к. проц находится всегда на одной частоте, но даже так замеры скачут

Добавлено через 4 минуты
DonkeyKong, стек после замеров не подчищен, хотя если после замера закрытие программы это не важно.
Kukuxumushu, Вариант для 64 бит хорош, только я бы всё-таки в стек скидывал первый замер, т.к. в измеряемой программе заранее не известно какие регистры будут использоваться.
1
Asm/C++/Delphi/Py/PHP/VBA
 Аватар для Jin X
6808 / 2048 / 238
Регистрация: 14.12.2014
Сообщений: 4,297
Записей в блоге: 12
05.11.2016, 00:04
Лучший ответ Сообщение было отмечено DonkeyKong как решение

Решение

Для повышения точности я бы сделать цикл и прогнал код раз этак 100 или лучше 1000, а потом взял среднее арифметическое (за вычетом "холостого" кода).
p.s. Вообще, лучше юзать не rdtsc, а rdtscp, т.к. он сбрасывает конвейер. Хотя, будет ли это заметно - вопрос.
Можно ещё сделать SetThreadPriority(GetCurrentThreadId, THREAD_PRIORITY_TIME_CRITICAL), правда, у меня на замерах это никак не отразилось...

Добавлено через 31 минуту
Вот здесь можно посмотреть экзамплы по измерению тактов от известного оптимизатора Agner'а Fog'а:
http://www.agner.org/optimize/
Файл: http://www.agner.org/optimize/testp.zip
Что там внутри - не знаю, не ковырялся, но там и мануал какой-то есть в архиве...
1
Эксперт Hardware
Эксперт Hardware
 Аватар для R71MT
6206 / 2441 / 402
Регистрация: 29.07.2014
Сообщений: 3,174
Записей в блоге: 4
05.11.2016, 23:53
читай порт(40h):
Assembler
1
2
3
4
5
6
in  eax,40h
push eax
;...
in eax 40h..
pop ebx
sub eax,ebx
0
Asm/C++/Delphi/Py/PHP/VBA
 Аватар для Jin X
6808 / 2048 / 238
Регистрация: 14.12.2014
Сообщений: 4,297
Записей в блоге: 12
06.11.2016, 00:17
R71MT, кто ж его ему даст прочитать? Да и насколько я помню, это просто таймер, ничего общего с тактами процессора не имеющий.
0
 Аватар для Ol44
197 / 89 / 15
Регистрация: 10.07.2016
Сообщений: 146
06.11.2016, 14:21
Цитата Сообщение от Jin X Посмотреть сообщение
Для повышения точности я бы сделать цикл и прогнал код раз этак 100 или лучше 1000, а потом взял среднее арифметическое (за вычетом "холостого" кода).
Если программулина небольшая, "скачки" измерений будут очень велики. Например подпрограмма на несколько сотен тактов может неожиданно вырасти до 10000+ (например 1 раз из 50) и если всё усреднять это может быть "средней температурой по больнице". Хотя опять же можно немного усложнить алгоритм, для детектирования и выкидывания аномально высоких значений замеров.
Цитата Сообщение от Jin X Посмотреть сообщение
Вообще, лучше юзать не rdtsc, а rdtscp, т.к. он сбрасывает конвейер. Хотя, будет ли это заметно - вопрос.
На микрозамерах мб, а на 1 млн. тактов разумеется нет.
Цитата Сообщение от Jin X Посмотреть сообщение
Можно ещё сделать SetThreadPriority(GetCurrentThreadId, THREAD_PRIORITY_TIME_CRITICAL), правда, у меня на замерах это никак не отразилось...
Если у вас 1 активный поток, а система в этот момент находится в простое, смысла в этом нет. Если к примеру используется одноядерный процессор, а активных потоков 2 - съедающих весь отведённый ОСью квант времени и просящих еще, они будут конкурировать за ресурс "ядро" 50 на 50, но если одному из них дать приоритет, он и будет "главным". Если ядер много, система ничего не делает и нагрузки нет, кроме измеряемой программы, приоритет ничего не даст.
Цитата Сообщение от Jin X Посмотреть сообщение
насколько я помню, это просто таймер, ничего общего с тактами процессора не имеющий.
Можно заюзать нечто похожее GetTickCount однако там точность в размере 0,016 сек или плюс минус около 50млн. тактов.
1
Asm/C++/Delphi/Py/PHP/VBA
 Аватар для Jin X
6808 / 2048 / 238
Регистрация: 14.12.2014
Сообщений: 4,297
Записей в блоге: 12
06.11.2016, 19:14
Цитата Сообщение от Ol44 Посмотреть сообщение
Можно заюзать нечто похожее GetTickCount однако там точность в размере 0,016 сек или плюс минус около 50млн. тактов.
Тогда уж QueryPerformanceCounter/Frequency.

Интересно, что делает AIDA64 при запуске тестов? Там даже мышь с "заиканием" двигается...
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
06.11.2016, 19:14
Помогаю со студенческими работами здесь

Найти сколько страниц в книге если известно количество цифр затраченных на нумерацию
Доброго времени суток. Решил простенькую задачку, но код получился очень громоздкий, сплошь из if-ов. Может быть существует более красивый...

Кол-во тиков у таймера
Доброго времени суток, подскажите как посчитать количество тиков которые произвел таймер за время после включения , вариант получить время...

Сгенерировать uuid v1 из тиков даты
Есть тики некоторо даты, например `62135596800098765` как на их основании сгенерировать uuid v1 ? Есть ли в php готовые классы и библиотеки...

Перевод тиков FreeRTOS в миллисекунды
Добрый день! Пытаюсь перевести FreeRTOS'ные тики в миллисекунды - типа, реализация функции Sleep в миллисекундах, а не тиках. ...

Количество тиков таймера перевести в миллисекунды
как количество тиков таймера перевести в миллисекунды


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
11
Ответ Создать тему
Новые блоги и статьи
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 05.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 17.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
Фото: Daniel Greenwood
kumehtar 13.11.2025
Расскажи мне о Мире, бродяга
kumehtar 12.11.2025
— Расскажи мне о Мире, бродяга, Ты же видел моря и метели. Как сменялись короны и стяги, Как эпохи стрелою летели. - Этот мир — это крылья и горы, Снег и пламя, любовь и тревоги, И бескрайние. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru