|
|
|
Избыточное копирование объекта при реализации оператора умножения и оператора присваивания21.03.2016, 18:43. Показов 5113. Ответов 84
Метки нет (Все метки)
Есть класс работы с матрицами. Есть операция умножения матриц, описанная как оператор класса. В данном коротком примере я просто моделирую ситуацию. Реальное наполнение класса принципиальной разницы не играет, нужно просто понимать, что оператор умножения будет иметь большой код, оператор присваивания в реализации тоже будет не пустым. Эти места в примере засвечены комментариями
C++ #include <cstdio> class Matrix { private: // внутренние данные матрицы public: Matrix (); Matrix (const Matrix&); ~Matrix (); Matrix& operator=(const Matrix& a); Matrix operator*(const Matrix& a) const; }; Matrix::Matrix () { printf ("Matrix ()\n"); }; Matrix::Matrix (const Matrix&) { printf ("Matrix (const Matrix&)\n"); }; Matrix::~Matrix () { printf ("~Matrix ()\n"); }; Matrix& Matrix::operator=(const Matrix& a) { printf ("operator=(const Matrix&)\n"); // тут как бы код, копирущий данные из "a" в "this" return *this; } Matrix Matrix::operator*(const Matrix& a) const { printf ("operator*(const Matrix&)\n"); Matrix result; // тут как бы код, умножающий "a" и "this" и записывающий // данные в "result" return result; } Matrix a, b, c; int main (void) { printf ("------------------\n"); a = b * c; printf ("------------------\n"); } Code $ g++-4.8 t.cc $ ./a.out Matrix () Matrix () Matrix () ------------------ operator*(const Matrix&) Matrix () operator=(const Matrix&) ~Matrix () ------------------ ~Matrix () ~Matrix () ~Matrix () Посмотрим на ассемблерный код. Компилирую с опцией -fno-inline, чтобы оставаться с короткой программой и не разводить геморрой по борьбе с inline'ом со стороны компилятора. В общем случае тела операторов класса Matrix будут в отдельном файле и НЕ будут доступны для inline'а. Опцию -fno-exceptions подаю, чтобы было меньше мусора в коде Code $ g++ t.cc -O2 -fno-inline -fno-exceptions $ cat t.s ... leal -9(%ebp), %ebx subl $32, %esp movl %ebx, (%esp) movl $c, 8(%esp) movl $b, 4(%esp) call _ZN6MatrixmlERKS_ <- operator* subl $4, %esp movl %ebx, 4(%esp) movl $a, (%esp) call _ZN6MatrixaSERKS_ <- operator= ... C typedef struct { /* внутренности */ } Matrix; extern void operator_assign (Matrix *this, const Matrix *value); extern void operator_mul (Matrix *result, const Matrix *this, const Matrix *operand2); Matrix a, b, c; int main (void) { Matrix tmp; operator_mul (&tmp, &b, &c); /* tmp = b.operator* (c) */ operator_assign (&a, &tmp); /* a.operator= (tmp) */ } C operator_mul (&a, &b, &c); Вопрос. Как правильно написать текст на C++, чтобы получить код, эквивалентный вышеприведённой эффективной реализации на C? Оставаясь при этом в объёме стандарта C++98. Оставляя исходник в понятном и читабельном виде, без использования извращений типа семиэтажных шаблонов и т.п.
0
|
|
| 21.03.2016, 18:43 | |
|
Ответы с готовыми решениями:
84
Неправильная работа оператора присваивания после работы оператора суммирования От каких ошибок страхует Const при перегрузке оператора присваивания
|
|
1379 / 406 / 144
Регистрация: 22.10.2014
Сообщений: 872
|
||||||||||||
| 22.03.2016, 18:15 | ||||||||||||
+ отсутствие каких либо ветвлений, я с трудом догадываюсь что может показывать такую разницу кроме хорошего работающего илайнинга, и готов рискнуть в данном случае показаться идиотом мерящим качество кода количеством инструкций ![]() Кликните здесь для просмотра всего текста
Так что даже если она высока, то? Но да, об этом я сильно не думал. Ибо по моей оценке умножение 100 миллионов матриц стоит гораздо больше чем соответствующее "выделение" памяти менеджером. Но опять же никто не говорит что компилятор способен решить все наши проблемы и С подход также имеет место быть, но не из-за копирований, а из-за кэш миссов в больших объемах данных и благодаря С подходу и определенному размещению ресурсов в памяти мы можем выиграть и скорее всего выиграем, ибо кэшмиссы это адски дорого. Но плюсовый оверхед сводится на нет оптимизациями компилятора.
0
|
||||||||||||
|
|
||
| 22.03.2016, 18:20 [ТС] | ||
|
Конкретно при работе с графикой матрица действительно будет фиксированного размера (4), да ещё и квадратная. В таких условиях код получится очень конкретным (т.е. далеко не кодом в самом общем случае), а потому его можно будет по простому реализовать в "эффективной" манере и он не будут уступать коду на Си Я плохо знаю Си++, в том смысле, что непосредственно на нём не программирую. Я знал о перегруженных операторах, но никогда особо не задумывался о том, в каких рамках оно описывается в языке (т.е. это обязательно бинарные операторы). Ну вот дорвался до конкретного примера, в котором нужно было копнуть, увидел неоптимальность. Вот и хотел понять, можно ли её простыми и неизвращёнными способами побороть
0
|
||
|
8973 / 4319 / 960
Регистрация: 15.11.2014
Сообщений: 9,760
|
|
| 22.03.2016, 18:25 | |
|
0
|
|
|
19491 / 10097 / 2460
Регистрация: 30.01.2014
Сообщений: 17,805
|
|||||||
| 22.03.2016, 18:28 | |||||||
|
Т.е., в псевдокоде, будет следующее:
0
|
|||||||
|
8973 / 4319 / 960
Регистрация: 15.11.2014
Сообщений: 9,760
|
||
| 22.03.2016, 18:35 | ||
|
как отличить объект, который можно грабить, от того, который нельзя.
0
|
||
|
Игогошка!
1801 / 708 / 44
Регистрация: 19.08.2012
Сообщений: 1,367
|
||
| 22.03.2016, 18:37 | ||
0
|
||
|
19491 / 10097 / 2460
Регистрация: 30.01.2014
Сообщений: 17,805
|
||
| 22.03.2016, 18:37 | ||
operator_mul (&a, &b, &c);. Техника называется expression templates. Есть статья здесь (здесь и короткий пример здесь), а также описание в книжке Йосуттиса "Шаблоны, справочник разработчика".Возможно тебе это и не интересно в контексте темы, но возможно кого-то мимоходом заглянувшего заинтересует.
2
|
||
|
|
|||||||
| 22.03.2016, 18:47 [ТС] | |||||||
|
Добавлено через 9 минут
0
|
|||||||
|
1379 / 406 / 144
Регистрация: 22.10.2014
Сообщений: 872
|
||
| 22.03.2016, 19:01 | ||
|
Отказываться от супер киллерфичи это очень грустно. Касательно памяти, да, да, да, именно об этом я говорил о "прогретости" памяти, которая играет на руку С подходу. Собственно я "прогрел" память и проверил и СРР подход стабильно быстрее С подхода. Надеюсь не нужно бесполезные листинги кода прикладывать) Ну а если инлайнинг недоступен, т.е. код не в заголовочном файле, аля библиотека какая-то, хотя и тут же можно LTO прикрутить , то тут конечно проблемы.И будет наверное единственный вариант, писать шаблонные врапперы скрывающие за собой С подход. Но я бы не назвал это "не извращениями".
0
|
||
|
|
|||
| 22.03.2016, 21:17 [ТС] | |||
|
По поводу LTO. Это всё-таки технология борьбы с криво написанными исходниками, и только во вторую очередь оптимизация. В варианте с закрытыми исходниками или с кодами под GPU она явно отваливает. LTO - это технология, привязанная к конкретной версии конкретного компилятора. Т.е. надеясь на LTO ты не сможешь нормально распространять библиотеки в бинарниках. Поэтому технология LTO сама по себе является извращением, работающим лишь в ограниченных случаях Добавлено через 10 минут С подходом Си эта колбаса нормально ляжет в функцию с закрытым кодом, а накладные расходы на её вызов будут намного меньше, чем время выполнения тела функции. С подходом Си++ колбасу не получится упрятать в закрытый код. Точнее, если упрятать, то не получится избавиться от оператора присваивания (а это 16 операций load и 16 операций store). Даже если тело оператора будет доступно, но будет содержать вызов функции, то компилятор, видя взятие адреса на объект, не сможет избавится от копирования
0
|
|||
|
1379 / 406 / 144
Регистрация: 22.10.2014
Сообщений: 872
|
||||
| 22.03.2016, 21:53 | ||||
|
Если же статическая линковка, то LTO отлично отработает, да, придется поставлять в два раза больше библиотек, но это возможно. Я вот например и буст собираю с LTO, тьфу тьфу работает под 7-мью платформами. Я бы согласился с следующей причиной, что какой-то старый код не собирается с O3 и lto и этого кода много, тут я могу лишь посочувствовать и согласится с причиной. Но в остальных случаях - просто не использование предоставленных инструментов и объявление что технология без них плоха - как-то не серьёзно звучит.
0
|
||||
|
Комп_Оратор)
|
|
| 23.03.2016, 00:12 | |
|
Evg, я наверное вообще ничего не понял. Потому и спрошу. Скажи, вот ты сравниваешь перегруженный оператор класса С++ с функцией С. А почему? На С++ легко можно написать функцию принимающую три адресных аргумента. По ссылке ли по указателю ли не суть. И нет копирования в том же смысле в котором его нет в псевдо операторе - функции mul.
Пользовательский оператор же упрощает написание кода. Звезда, кстати используется для разыменования, хотя и умножать никто не запретит. Но неважно. Важно, что компилятор и так сложен, зачем заставлять его строить выражения не создавая промежуточных переменных? Если скорость нужна, то можно же функциями писать. Если это не изврат тогда что? Хотя и быстро. Это можно делать и на С++. Но ведь чтобы сравнивать пользовательский оператор С++ корректно, его нужно сравнивать с пользовательским оператором С. А и нету его. А есть функция принимающая три адреса. А почему не функция принимающая два адреса и возвращающая значение (копия)? Наверное, опять же, я не понимаю самую суть вопроса.
0
|
|
|
|
||||||||
| 23.03.2016, 10:39 [ТС] | ||||||||
|
2
|
||||||||
|
19491 / 10097 / 2460
Регистрация: 30.01.2014
Сообщений: 17,805
|
||
| 23.03.2016, 10:53 | ||
|
Лично я в таких ситуациях пишу интерфейс на С. Прячу оптимизированные варианты функций в бинарник (так же как и ты хотел). К интерфейсу на С прикладываю заголовочный файл на С++, который с помощью простых inline оберток (или шаблонных махинаций) добавляет этому интерфейсу "С++-сность". Естественно вся эта тонкая прослойка инлайнится и в результате имеем машинный код, построенный так, как будто бы мы напрямую использовали С интерфейс. При этом не страдает кросскомпиляторность, при желании можно перебиндить интерфейс в какой-нибудь питон или C# и т.п.
0
|
||
|
Комп_Оратор)
|
|||||||
| 23.03.2016, 11:13 | |||||||
|
Истоки, - в общем подходе сокращающем трудозатраты. Передача и возврат по значению сами по себе обязаны своим существованием механизму стека. Стек это удобно, и иногда даже быстро, но иногда и накладно. С операторами то же самое как я понимаю. Можно создать компилятор который будет строить вычислительную цепь не используя промежуточных переменных везде где возможно. Иногда приходится всё равно. Выражение:
С другой стороны, на С++ вполне можно писать функции. ![]() В целом, мне понравилась тема. Не каждый задумывается о подобных резервах производительности. Может если скорость нужна любой ценой, то это один из путей. Особенно если алгоритм не слишком поднимает трудозатраты.
1
|
|||||||
|
Игогошка!
1801 / 708 / 44
Регистрация: 19.08.2012
Сообщений: 1,367
|
|||||
| 23.03.2016, 12:40 | |||||
|
Это она и есть. И решение куда элегантнее "сишного подхода" в лоб.
0
|
|||||
|
1379 / 406 / 144
Регистрация: 22.10.2014
Сообщений: 872
|
||||||||||||||||||
| 23.03.2016, 13:06 | ||||||||||||||||||
![]() И насчёт предельной эффективности см. ниже. флаги: -O3 -flto Math.h Кликните здесь для просмотра всего текста
Math.cpp Кликните здесь для просмотра всего текста
main.cpp Кликните здесь для просмотра всего текста
Результаты: 99999999 196025-fill 99999999 1958025-cpp 99999999 2202373-cpp no-inline + 1 copy ctor 99999999 2784633-c Я если честно сам несколько удивлен результатами, слишком радужны, особенно no-inline версия. Но я не сомневаюсь, что дав сегодня возможность компилятору оптимизировать код - он сделает его лучше, чем мои потуги с С подходом.
0
|
||||||||||||||||||
|
1550 / 877 / 179
Регистрация: 05.12.2015
Сообщений: 2,555
|
|||
| 23.03.2016, 13:48 | |||
|
0
|
|||
|
|
||||||
| 23.03.2016, 14:35 [ТС] | ||||||
|
0
|
||||||
|
1550 / 877 / 179
Регистрация: 05.12.2015
Сообщений: 2,555
|
|
| 23.03.2016, 14:44 | |
|
0
|
|
| 23.03.2016, 14:44 | |
|
Помогаю со студенческими работами здесь
60
Какое значение получит переменная p при выполнении следующего оператора присваивания? Ошибка при выполнении оператора присваивания производного класса через указатель на базовый Ошибка при реализации перегрузки оператора <<
Переопределение оператора присваивания Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
|
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
|
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут.
В век Веб все очень привыкли к дизайну Single-Page-Application .
Быстренько разберем подход "на фреймах".
Мы делаем одну. . .
|