Аватар для eva2326
1673 / 501 / 107
Регистрация: 17.05.2015
Сообщений: 1,518

Strict aliasing вынуждает писать неэффективный код

19.10.2025, 06:21. Показов 4247. Ответов 4

Студворк — интернет-сервис помощи студентам
Всем привет.

Есть шаблон функции, логику которой нужно перенести в файл.cpp

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
#include <iostream>
#include <cassert>
#include <cstring>
 
using u32_t = std::uint32_t;
 
template<class ch> void foo(const ch* bit32)
{
    assert(bit32);
    static_assert(sizeof(bit32[0]) == 4, "expected 32 bit value");
    while(*bit32)
        std::cout << static_cast<u32_t>(*bit32++) << " ";
    std::cout << '\n';
}
 
int main()
{
    wchar_t arr[] = L"123";
    foo(arr);
}
Указатели, с которыми работает шаблон, представляют числовые последовательности.
В данном примере ожидается последовательность 32 битных чисел.
Тип числа можно быть, например std::uint32_t, или например wchar_t (на линукс платформах)
Или char32_t, в общем - любой числовой 32х битный тип.


Что бы перенести логику в файл.cpp, нужно сделать обычную (нешаблонную) функцию, способную принимать указатели разных типов.

Первое, что приходит в голову: передача void*, с последующей реинтерпретацией типа указателя:

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
#include <iostream>
#include <cassert>
#include <cstdint>
 
using u32_t = std::uint32_t;
 
namespace detail
{
    void foo(const void* bit32)
    {
        assert(bit32);
        const u32_t* p = static_cast<const u32_t*>(bit32);
        while(*p)
            std::cout << *p++ << " ";
        std::cout << '\n';
    }
    
} // namespace detail
 
template<class ch> void foo(const ch* bit32)
{
    static_assert(sizeof(*bit32) == 4, "expected 32 bit value");
    detail::foo(bit32);
}
 
int main()
{
    wchar_t arr[] = L"123";
    foo(arr);
}
Такой подход обладает двумя важнейшими достоинствами: простота и эффективность.
Но у него есть один фатальный недостаток: код содержит UB

Что бы устранить UB, нужно использовать что-то вроде std::bit_cast
Но тогда начинает страдать читабельность, а так же эффективность:

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
#include <iostream>
#include <cassert>
#include <cstdint>
#include <cstring>
 
using byte_t = unsigned char;
using u32_t = std::uint32_t;    
 
namespace detail
{
    void foo(const byte_t* bit32)
    {
        assert(bit32);
        u32_t val = 0;
        do
        {
            std::memcpy(&val, bit32, sizeof(u32_t));
            bit32 += sizeof(u32_t);
            if(val != 0)
                std::cout << val << " ";
        }
        while(val != 0);
        std::cout << '\n';
    }
    
} // namespace detail
 
template<class ch> void foo(const ch* bit32)
{
    static_assert(sizeof(*bit32) == 4, "expected 32 bit value");
    detail::foo(reinterpret_cast<const byte_t*>(bit32) );
}
 
int main()
{
    wchar_t arr[] = L"123";
    foo(arr);
}

Читабельность ещё можно более менее сохранить за счет вспомогательных инструментов.

Например

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
#include <iostream>
#include <cassert>
#include <cstdint>
#include <cstring>
 
#if defined (_MSC_VER) && _MSC_VER <= 1800                    // msvc[old: 2013]
    #define noexcept throw()
#endif
 
namespace experiment
{
    typedef unsigned char byte_t;
 
    template<class elem> struct sequence 
    {
        struct element
        {
            element(byte_t* data) noexcept
                : m_cur(data)
            {}
 
            operator elem() const
            {
                elem val = 0;
                std::memcpy(&val, this->m_cur, sizeof(elem));
                return val;
            }
 
            void operator+=(const elem& val)
            {
                elem cur = *this;
                cur += val;
                this->operator=(cur);
            }
 
            element& operator++() // ++it
            {
                elem cur = *this;
                ++cur;
                this->operator=(cur);
                return *this;
            }
 
            element operator++(int) // it++
            {
                const element temp(*this);
                ++(*this);
                return temp;
            }
 
            element& operator=(const elem& val)
            {
                assert(this->m_cur);
                std::memcpy(this->m_cur, &val, sizeof(elem));
                return *this;
            }
            byte_t* m_cur;
        };
 
        struct iterator
        {
            iterator(byte_t* data) noexcept
                : m_cur(data)
            {}
            
            iterator& operator++() // ++it
            {
                this->m_cur += sizeof(elem); 
                return *this;
            }
        
            bool operator==(const iterator& iter) const noexcept
            {
                return this->m_cur == iter.m_cur;
            }
            
            bool operator!=(const iterator& iter) const noexcept
            {
                return this->m_cur != iter.m_cur;
            }
        
            element operator*() const noexcept
            {
                assert(this->m_cur);
                return element(this->m_cur);
            }
        private:        
            byte_t* m_cur;
        };
 
        template<class t> sequence(t* data) noexcept
            : m_beg()
            , m_end()
        {
            assert(data);
            static_assert(sizeof(t) == sizeof(elem), "invalid size");
            this->m_beg = reinterpret_cast<byte_t*>(data);
            while(*data)
                ++data;
            this->m_end = reinterpret_cast<byte_t*>(data);
        }
 
        sequence(byte_t* data) noexcept
            : m_beg(data)
            , m_end(data)
        {
            assert(data);
            while(*this->m_end)
                ++this->m_end;
        }
        
        iterator begin() const noexcept
        {
            return iterator(this->m_beg);
        }
 
        iterator end() const noexcept
        {
            return iterator(this->m_end);
        }
        
    private:        
        byte_t* m_beg;
        byte_t* m_end;
    };
 
} // namespace experiment
 
using sequence16_t = experiment::sequence<std::uint32_t>;
 
void foo(const sequence16_t& sequence)
{
    for(const auto elem: sequence)
    std::cout << elem << " ";
        std::cout << '\n';
}
    
int main()
{
    wchar_t arr1[] = L"123";
    std::uint32_t arr2[] = { 49, 50, 51, 0};
    foo(arr1);
    foo(arr2);
}


Однако с эффективностью беда: memcpy на каждой итерации.
А если надо будет изменить значение элемента, тогда нужно будет делать ещё одно memcpy.

Можно попробовать выкрутиться за счет type erasure, но в таком варианте эффективность так же пострадает, из-за использования полиморфизма.
type erasure

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
#include <iostream>
#include <cassert>
#include <cstdint>
#include <string>
 
#ifdef __GNUC__
    #pragma GCC diagnostic push
    #pragma GCC diagnostic ignored "-Wnon-virtual-dtor"
#endif
 
#if defined (_MSC_VER) && _MSC_VER <= 1800                    // msvc[old: 2013]
    #define noexcept throw()
#endif
 
 
namespace experiment
{
    template<class ret> struct base
    {
        virtual ret operator[](const size_t index) const = 0;
        virtual void set(const size_t index, const ret&) const = 0;
    
    };
 
    template<class t, class ret> struct sequence : base<ret>
    {
        sequence(t* data) noexcept: 
            m_data(data)
        {}
 
        virtual ret operator[](const size_t index) const
        {
            return static_cast<ret>(this->m_data[index]);
        }
 
        virtual void set(const size_t index, const ret& val) const
        {
            this->m_data[index] = val;
        }
 
        t* m_data;
    };
 
} // namespace experiment
 
#ifdef __GNUC__
    #pragma GCC diagnostic pop
#endif
 
 
void bar(const experiment::base<std::uint16_t>& p)
{
    for(size_t i = 0; p[i]; ++i)
    {
        std::uint16_t v = p[i];
        std::cout << p[i] << ", ";
        p.set(i, ++v);
    }
    std::cout << '\n';
}
 
template<class ch> void foo(ch* p)
{
    bar(experiment::sequence<ch, std::uint16_t>(p));
}
 
int main()
{
    const std::wstring etalon = L"234";
    wchar_t result[] = L"123";
    foo(result);
    assert(result == etalon);
}


Для новых компиляторов можно выкрутиться за счет std::launder, а лучше сразу std::start_lifetime_as
Потому что у std::launder тоже есть какие то проблемы.
И, кстати, я так и не поняла, с чем связанно UB ?

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
#include <complex>
#include <iostream>
#include <memory>
 
int main()
{
    alignas(std::complex<float>) unsigned char network_data[sizeof(std::complex<float>)]
    {
        0xcd, 0xcc, 0xcc, 0x3d, 0xcd, 0xcc, 0x4c, 0x3e
    };
 
 
//  auto d1 = *std::launder(reinterpret_cast<std::complex<float>*>(network_data));
//  std::cout << d1 << '\n'; // UB: implicitly created objects have dynamic storage
//                                  duration and have indeterminate value initially,
//                                  even when an array which provides storage for
//                                  them has determinate bytes.
//                                  See also CWG2721.
 
    auto d2 = *std::start_lifetime_as<std::complex<float>>(network_data);
    std::cout << d2 << '\n'; // OK
}
Причем тут CWG2721, я тоже не поняла.


Итого, у меня 3 вопроса:
1) С чем связанно UB в примере использования std::launder?
2) Как грамотно решить задачу для старых компиляторов (c++98) ?
3) Как грамотно решить задачу для новых компиляторов?

Приведите, пожалуйста, код решения.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
19.10.2025, 06:21
Ответы с готовыми решениями:

Union, new placement, strict-aliasing, cross-platform
Доброго времени суток. Ниже представленный код вроде бы работает. Гонял его на компиляторах...

Каламбур типизации и strict aliasing
Есть ли какой-то стандартный способ обойти strict aliasing, с гарантией от UB? Конкретная задача:...

Strict aliasing и memcpy
Что-то я никак не врублюсь, как согласуются между собой strict aliasing и функции жонглирующие...

4
фрилансер
 Аватар для Алексей1153
6455 / 5656 / 1129
Регистрация: 11.10.2019
Сообщений: 15,062
19.10.2025, 09:05
Цитата Сообщение от eva2326 Посмотреть сообщение
Однако с эффективностью беда: memcpy на каждой итерации.
для фундаментальных типов std::memcpy компилятор обычно не вызывает как функцию, так что с эффективностью тут не должно быть проблем:

https://godbolt.org/z/rjenPs9dY

std::memcpy(&val, bit32, sizeof(u32_t));

mov rax, QWORD PTR [rbp-24]
mov eax, DWORD PTR [rax]
mov DWORD PTR [rbp-4], eax



----------

А насчёт void*. Я почему-то считал, что это тоже исключение для strict aliasing
Ведь и функции есть, которые его принимают - qsort, memcpy и так далее
2
97 / 73 / 27
Регистрация: 30.03.2023
Сообщений: 201
20.10.2025, 13:55
Насколько я понимаю, решается это вопрос примерно так:
If a program attempts to access the stored value of an object through a glvalue
Но void* не используется для доступа к памяти, поэтому на него это правило не распространяется.
А вот на полученное тобой p:
C++
1
const u32_t* p = static_cast<const u32_t*>(bit32);
уже будет распространяться.
0
1968 / 824 / 115
Регистрация: 01.10.2012
Сообщений: 4,875
Записей в блоге: 2
21.10.2025, 01:22
Цитата Сообщение от eva2326 Посмотреть сообщение
Но у него есть один фатальный недостаток: код содержит UB
Не постесняюсь спросить: а чего (или где) он его содержит? Лично я никакого UB не вижу. А "потерял нить" я еще раньше
Цитата Сообщение от eva2326 Посмотреть сообщение
Что бы перенести логику в файл.cpp, нужно сделать обычную (нешаблонную) функцию, способную принимать указатели разных типов.
Зачем же делать темплейт чтобы потом обходиться без него?
0
Вездепух
Эксперт CЭксперт С++
 Аватар для TheCalligrapher
12937 / 6804 / 1821
Регистрация: 18.10.2014
Сообщений: 17,218
21.10.2025, 09:30
Цитата Сообщение от Алексей1153 Посмотреть сообщение
А насчёт void*. Я почему-то считал, что это тоже исключение для strict aliasing
В смысле "тоже"? Исключением из strict aliasing является тип указуемых данных, а не тип указателя. В частности, переинтерпретация указуемых данных как массива типа char является исключением. А через какой промежуточный тип указателя это сделано - не имеет значения.

Цитата Сообщение от Алексей1153 Посмотреть сообщение
Ведь и функции есть, которые его принимают - qsort, memcpy и так далее
Эти функции внутри переинтерпретируют указуемые данные именно как массив char. А то, что указатель на входе был void * ни на что здесь не влияет.

Добавлено через 6 минут
Цитата Сообщение от Igor3D Посмотреть сообщение
Зачем же делать темплейт чтобы потом обходиться без него?
Во-первых, темплейт зачастую делают лишь для контроля корректности типов на уровне интерфейса. А затем на уровне реализации "обходятся без него", делегируя вызов из тонкой темплейтной оболочки в одну и ту же нетемплейтную функцию, построенную на базе void *. Это делается из старых как мир соображений: сокрытие реализации и избежание разбухания кода.

Во-вторых, все назначение темплейтных примитивов, выполняющих type erasure (например, std::function<>), как раз и сводится к тому, чтобы "написать темплейт", который "вберет в себя" всю темплейтность и тем самым позволит нам устранить (или уменьшить) темплейтность окружающего кода. Для достижения тех же целей: сокрытие реализации и избежание разбухания кода.
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
21.10.2025, 09:30
Помогаю со студенческими работами здесь

dereferencing type-punned pointer will break strict-aliasing rules
Есть кусок кода: void ReadInitialSettings(Settings &amp;mysettings) { for (uint16_t i = 0; i &lt;...

strict aliasing and custom structure
Добрый день. Классический пример, который наглядно показывает что такое strict aliasing,...

strict c++ : 64 bit int
strict c++ : 64 bit int как можно задать 64 битную целую переменную? желательно без...

Не могу дальше писать программу из-за того что не могу, не умею писать БД
Здравствуйте помогите написать БД. Я создаю программу, которая будет работать с данными!...

Помогите писать на С++ через шаблоны. Консуле я писал, но надо писать исползуя шаблоны
В одномерном массиве, состоящем из п вещественных элементов, вычислить: 1) количество элементов...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Опции темы

Новые блоги и статьи
Символьное дифференцирование
igorrr37 13.02.2026
/ * Логарифм записывается как: (x-2)log(x^2+2) - означает логарифм (x^2+2) по основанию (x-2). Унарный минус обозначается как ! */ #include <iostream> #include <stack> #include <cctype>. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru