|
|
|
Избыточное копирование объекта при реализации оператора умножения и оператора присваивания21.03.2016, 18:43. Показов 5613. Ответов 84
Метки нет (Все метки)
Есть класс работы с матрицами. Есть операция умножения матриц, описанная как оператор класса. В данном коротком примере я просто моделирую ситуацию. Реальное наполнение класса принципиальной разницы не играет, нужно просто понимать, что оператор умножения будет иметь большой код, оператор присваивания в реализации тоже будет не пустым. Эти места в примере засвечены комментариями
C++ #include <cstdio> class Matrix { private: // внутренние данные матрицы public: Matrix (); Matrix (const Matrix&); ~Matrix (); Matrix& operator=(const Matrix& a); Matrix operator*(const Matrix& a) const; }; Matrix::Matrix () { printf ("Matrix ()\n"); }; Matrix::Matrix (const Matrix&) { printf ("Matrix (const Matrix&)\n"); }; Matrix::~Matrix () { printf ("~Matrix ()\n"); }; Matrix& Matrix::operator=(const Matrix& a) { printf ("operator=(const Matrix&)\n"); // тут как бы код, копирущий данные из "a" в "this" return *this; } Matrix Matrix::operator*(const Matrix& a) const { printf ("operator*(const Matrix&)\n"); Matrix result; // тут как бы код, умножающий "a" и "this" и записывающий // данные в "result" return result; } Matrix a, b, c; int main (void) { printf ("------------------\n"); a = b * c; printf ("------------------\n"); } Code $ g++-4.8 t.cc $ ./a.out Matrix () Matrix () Matrix () ------------------ operator*(const Matrix&) Matrix () operator=(const Matrix&) ~Matrix () ------------------ ~Matrix () ~Matrix () ~Matrix () Посмотрим на ассемблерный код. Компилирую с опцией -fno-inline, чтобы оставаться с короткой программой и не разводить геморрой по борьбе с inline'ом со стороны компилятора. В общем случае тела операторов класса Matrix будут в отдельном файле и НЕ будут доступны для inline'а. Опцию -fno-exceptions подаю, чтобы было меньше мусора в коде Code $ g++ t.cc -O2 -fno-inline -fno-exceptions $ cat t.s ... leal -9(%ebp), %ebx subl $32, %esp movl %ebx, (%esp) movl $c, 8(%esp) movl $b, 4(%esp) call _ZN6MatrixmlERKS_ <- operator* subl $4, %esp movl %ebx, 4(%esp) movl $a, (%esp) call _ZN6MatrixaSERKS_ <- operator= ... C typedef struct { /* внутренности */ } Matrix; extern void operator_assign (Matrix *this, const Matrix *value); extern void operator_mul (Matrix *result, const Matrix *this, const Matrix *operand2); Matrix a, b, c; int main (void) { Matrix tmp; operator_mul (&tmp, &b, &c); /* tmp = b.operator* (c) */ operator_assign (&a, &tmp); /* a.operator= (tmp) */ } C operator_mul (&a, &b, &c); Вопрос. Как правильно написать текст на C++, чтобы получить код, эквивалентный вышеприведённой эффективной реализации на C? Оставаясь при этом в объёме стандарта C++98. Оставляя исходник в понятном и читабельном виде, без использования извращений типа семиэтажных шаблонов и т.п.
0
|
|
| 21.03.2016, 18:43 | |
|
Ответы с готовыми решениями:
84
Неправильная работа оператора присваивания после работы оператора суммирования От каких ошибок страхует Const при перегрузке оператора присваивания
|
|
1379 / 406 / 144
Регистрация: 22.10.2014
Сообщений: 872
|
||||||||||||
| 22.03.2016, 18:15 | ||||||||||||
+ отсутствие каких либо ветвлений, я с трудом догадываюсь что может показывать такую разницу кроме хорошего работающего илайнинга, и готов рискнуть в данном случае показаться идиотом мерящим качество кода количеством инструкций ![]() Кликните здесь для просмотра всего текста
Так что даже если она высока, то? Но да, об этом я сильно не думал. Ибо по моей оценке умножение 100 миллионов матриц стоит гораздо больше чем соответствующее "выделение" памяти менеджером. Но опять же никто не говорит что компилятор способен решить все наши проблемы и С подход также имеет место быть, но не из-за копирований, а из-за кэш миссов в больших объемах данных и благодаря С подходу и определенному размещению ресурсов в памяти мы можем выиграть и скорее всего выиграем, ибо кэшмиссы это адски дорого. Но плюсовый оверхед сводится на нет оптимизациями компилятора.
0
|
||||||||||||
|
|
||
| 22.03.2016, 18:20 [ТС] | ||
|
Конкретно при работе с графикой матрица действительно будет фиксированного размера (4), да ещё и квадратная. В таких условиях код получится очень конкретным (т.е. далеко не кодом в самом общем случае), а потому его можно будет по простому реализовать в "эффективной" манере и он не будут уступать коду на Си Я плохо знаю Си++, в том смысле, что непосредственно на нём не программирую. Я знал о перегруженных операторах, но никогда особо не задумывался о том, в каких рамках оно описывается в языке (т.е. это обязательно бинарные операторы). Ну вот дорвался до конкретного примера, в котором нужно было копнуть, увидел неоптимальность. Вот и хотел понять, можно ли её простыми и неизвращёнными способами побороть
0
|
||
|
8973 / 4319 / 960
Регистрация: 15.11.2014
Сообщений: 9,760
|
|
| 22.03.2016, 18:25 | |
|
0
|
|
|
19501 / 10106 / 2461
Регистрация: 30.01.2014
Сообщений: 17,825
|
|||||||
| 22.03.2016, 18:28 | |||||||
|
Т.е., в псевдокоде, будет следующее:
0
|
|||||||
|
8973 / 4319 / 960
Регистрация: 15.11.2014
Сообщений: 9,760
|
||
| 22.03.2016, 18:35 | ||
|
как отличить объект, который можно грабить, от того, который нельзя.
0
|
||
|
Игогошка!
1801 / 708 / 44
Регистрация: 19.08.2012
Сообщений: 1,367
|
||
| 22.03.2016, 18:37 | ||
0
|
||
|
19501 / 10106 / 2461
Регистрация: 30.01.2014
Сообщений: 17,825
|
||
| 22.03.2016, 18:37 | ||
operator_mul (&a, &b, &c);. Техника называется expression templates. Есть статья здесь (здесь и короткий пример здесь), а также описание в книжке Йосуттиса "Шаблоны, справочник разработчика".Возможно тебе это и не интересно в контексте темы, но возможно кого-то мимоходом заглянувшего заинтересует.
2
|
||
|
|
|||||||
| 22.03.2016, 18:47 [ТС] | |||||||
|
Добавлено через 9 минут
0
|
|||||||
|
1379 / 406 / 144
Регистрация: 22.10.2014
Сообщений: 872
|
||
| 22.03.2016, 19:01 | ||
|
Отказываться от супер киллерфичи это очень грустно. Касательно памяти, да, да, да, именно об этом я говорил о "прогретости" памяти, которая играет на руку С подходу. Собственно я "прогрел" память и проверил и СРР подход стабильно быстрее С подхода. Надеюсь не нужно бесполезные листинги кода прикладывать) Ну а если инлайнинг недоступен, т.е. код не в заголовочном файле, аля библиотека какая-то, хотя и тут же можно LTO прикрутить , то тут конечно проблемы.И будет наверное единственный вариант, писать шаблонные врапперы скрывающие за собой С подход. Но я бы не назвал это "не извращениями".
0
|
||
|
|
|||
| 22.03.2016, 21:17 [ТС] | |||
|
По поводу LTO. Это всё-таки технология борьбы с криво написанными исходниками, и только во вторую очередь оптимизация. В варианте с закрытыми исходниками или с кодами под GPU она явно отваливает. LTO - это технология, привязанная к конкретной версии конкретного компилятора. Т.е. надеясь на LTO ты не сможешь нормально распространять библиотеки в бинарниках. Поэтому технология LTO сама по себе является извращением, работающим лишь в ограниченных случаях Добавлено через 10 минут С подходом Си эта колбаса нормально ляжет в функцию с закрытым кодом, а накладные расходы на её вызов будут намного меньше, чем время выполнения тела функции. С подходом Си++ колбасу не получится упрятать в закрытый код. Точнее, если упрятать, то не получится избавиться от оператора присваивания (а это 16 операций load и 16 операций store). Даже если тело оператора будет доступно, но будет содержать вызов функции, то компилятор, видя взятие адреса на объект, не сможет избавится от копирования
0
|
|||
|
1379 / 406 / 144
Регистрация: 22.10.2014
Сообщений: 872
|
||||
| 22.03.2016, 21:53 | ||||
|
Если же статическая линковка, то LTO отлично отработает, да, придется поставлять в два раза больше библиотек, но это возможно. Я вот например и буст собираю с LTO, тьфу тьфу работает под 7-мью платформами. Я бы согласился с следующей причиной, что какой-то старый код не собирается с O3 и lto и этого кода много, тут я могу лишь посочувствовать и согласится с причиной. Но в остальных случаях - просто не использование предоставленных инструментов и объявление что технология без них плоха - как-то не серьёзно звучит.
0
|
||||
|
Комп_Оратор)
|
|
| 23.03.2016, 00:12 | |
|
Evg, я наверное вообще ничего не понял. Потому и спрошу. Скажи, вот ты сравниваешь перегруженный оператор класса С++ с функцией С. А почему? На С++ легко можно написать функцию принимающую три адресных аргумента. По ссылке ли по указателю ли не суть. И нет копирования в том же смысле в котором его нет в псевдо операторе - функции mul.
Пользовательский оператор же упрощает написание кода. Звезда, кстати используется для разыменования, хотя и умножать никто не запретит. Но неважно. Важно, что компилятор и так сложен, зачем заставлять его строить выражения не создавая промежуточных переменных? Если скорость нужна, то можно же функциями писать. Если это не изврат тогда что? Хотя и быстро. Это можно делать и на С++. Но ведь чтобы сравнивать пользовательский оператор С++ корректно, его нужно сравнивать с пользовательским оператором С. А и нету его. А есть функция принимающая три адреса. А почему не функция принимающая два адреса и возвращающая значение (копия)? Наверное, опять же, я не понимаю самую суть вопроса.
0
|
|
|
|
||||||||
| 23.03.2016, 10:39 [ТС] | ||||||||
|
2
|
||||||||
|
19501 / 10106 / 2461
Регистрация: 30.01.2014
Сообщений: 17,825
|
||
| 23.03.2016, 10:53 | ||
|
Лично я в таких ситуациях пишу интерфейс на С. Прячу оптимизированные варианты функций в бинарник (так же как и ты хотел). К интерфейсу на С прикладываю заголовочный файл на С++, который с помощью простых inline оберток (или шаблонных махинаций) добавляет этому интерфейсу "С++-сность". Естественно вся эта тонкая прослойка инлайнится и в результате имеем машинный код, построенный так, как будто бы мы напрямую использовали С интерфейс. При этом не страдает кросскомпиляторность, при желании можно перебиндить интерфейс в какой-нибудь питон или C# и т.п.
0
|
||
|
Комп_Оратор)
|
|||||||
| 23.03.2016, 11:13 | |||||||
|
Истоки, - в общем подходе сокращающем трудозатраты. Передача и возврат по значению сами по себе обязаны своим существованием механизму стека. Стек это удобно, и иногда даже быстро, но иногда и накладно. С операторами то же самое как я понимаю. Можно создать компилятор который будет строить вычислительную цепь не используя промежуточных переменных везде где возможно. Иногда приходится всё равно. Выражение:
С другой стороны, на С++ вполне можно писать функции. ![]() В целом, мне понравилась тема. Не каждый задумывается о подобных резервах производительности. Может если скорость нужна любой ценой, то это один из путей. Особенно если алгоритм не слишком поднимает трудозатраты.
1
|
|||||||
|
Игогошка!
1801 / 708 / 44
Регистрация: 19.08.2012
Сообщений: 1,367
|
|||||
| 23.03.2016, 12:40 | |||||
|
Это она и есть. И решение куда элегантнее "сишного подхода" в лоб.
0
|
|||||
|
1379 / 406 / 144
Регистрация: 22.10.2014
Сообщений: 872
|
||||||||||||||||||
| 23.03.2016, 13:06 | ||||||||||||||||||
![]() И насчёт предельной эффективности см. ниже. флаги: -O3 -flto Math.h Кликните здесь для просмотра всего текста
Math.cpp Кликните здесь для просмотра всего текста
main.cpp Кликните здесь для просмотра всего текста
Результаты: 99999999 196025-fill 99999999 1958025-cpp 99999999 2202373-cpp no-inline + 1 copy ctor 99999999 2784633-c Я если честно сам несколько удивлен результатами, слишком радужны, особенно no-inline версия. Но я не сомневаюсь, что дав сегодня возможность компилятору оптимизировать код - он сделает его лучше, чем мои потуги с С подходом.
0
|
||||||||||||||||||
|
1550 / 877 / 179
Регистрация: 05.12.2015
Сообщений: 2,555
|
|||
| 23.03.2016, 13:48 | |||
|
0
|
|||
|
|
||||||
| 23.03.2016, 14:35 [ТС] | ||||||
|
0
|
||||||
|
1550 / 877 / 179
Регистрация: 05.12.2015
Сообщений: 2,555
|
|
| 23.03.2016, 14:44 | |
|
0
|
|
| 23.03.2016, 14:44 | |
|
Какое значение получит переменная p при выполнении следующего оператора присваивания? Ошибка при выполнении оператора присваивания производного класса через указатель на базовый Ошибка при реализации перегрузки оператора <<
Переопределение оператора присваивания Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Алиса нашла кучу ошибок компиляции и запуска в проекте, который без проблем компилировался и запускался)))
anaschu 30.06.2026
Я пока посмеюся, но завтра проверю. А вообще интерсно. Дал алисе файл, в котором точно нет ошибок компиляции и запуска, и попросил их найти. Нашла кучу)))
Критические ошибки, мешающие компиляции и. . .
|
сукцессия 16. Общий обзор, в основном что бы другие ии поняли
anaschu 29.06.2026
# Передаточный документ: модель микоризной сукцессии (для нового чата)
Этот документ предназначен для того, чтобы новый чат Claude мог продолжить
работу без необходимости заново разбираться в. . .
|
сукцессия 15 неявная схема
anaschu 29.06.2026
Алиса
Калибровка параметров симбиотической модели: технический обзор
Содержание:
Введение
Постановка проблемы
Технические аспекты реализации
Процесс внедрения изменений
|
сукцессия 14. Обновленная схема модели
anaschu 28.06.2026
ГЛОБАЛЬНАЯ ОПИСАТЕЛЬНАЯ СПЕЦИФИКАЦИЯ ЭКОСИСТЕМНОЙ МОДЕЛИ «SOIL CHEMISTRY & MYCORRHIZA 2. 0»
https:/ / ibb. co/ NnkGpfMd
Представленная интегрированная схема описывает непрерывную нелинейную. . .
|
|
сукцессия 13. Питон модель трехзонного мицелия, пока что в основном арбускулярного
anaschu 28.06.2026
## Разработка агентной модели микоризной сукцессии: от выявления артефактов к созданию комплексной системы
### Аннотация
Представлено исследование по разработке агентной модели микоризной. . .
|
сукцессия 12. краткий список проверок модели перед запуском.
anaschu 27.06.2026
Скрытые отказы в моделях систем динамики (SD-models) экологических систем: два случая из практики
Контекст
Разбирался прототип модели систем динамики (SD-модели) микоризной сукцессии: пять. . .
|
Сукцессия 11. Проверка орудий перед войной: разработка через тестирование
anaschu 27.06.2026
Как не дать модели соврать самой себе: проверки для симуляции микоризной сукцессии
Введение
Когда вы строите математическую модель живой системы — грибов, растений, почвы — главная опасность. . .
|
10 сукцессия. Питон код войны грибов и растений
anaschu 27.06.2026
import numpy as np
class PlantAgent:
def __init__(self, name, strategy, initial_biomass):
self. name = name
self. strategy = strategy # "greedy" (широколиственные) или. . .
|