Форум программистов, компьютерный форум, киберфорум
C++
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/1: Рейтинг темы: голосов - 1, средняя оценка - 5.00
 Аватар для eva2326
1673 / 501 / 107
Регистрация: 17.05.2015
Сообщений: 1,518

Strict aliasing вынуждает писать неэффективный код

19.10.2025, 06:21. Показов 3719. Ответов 4

Студворк — интернет-сервис помощи студентам
Всем привет.

Есть шаблон функции, логику которой нужно перенести в файл.cpp

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
#include <iostream>
#include <cassert>
#include <cstring>
 
using u32_t = std::uint32_t;
 
template<class ch> void foo(const ch* bit32)
{
    assert(bit32);
    static_assert(sizeof(bit32[0]) == 4, "expected 32 bit value");
    while(*bit32)
        std::cout << static_cast<u32_t>(*bit32++) << " ";
    std::cout << '\n';
}
 
int main()
{
    wchar_t arr[] = L"123";
    foo(arr);
}
Указатели, с которыми работает шаблон, представляют числовые последовательности.
В данном примере ожидается последовательность 32 битных чисел.
Тип числа можно быть, например std::uint32_t, или например wchar_t (на линукс платформах)
Или char32_t, в общем - любой числовой 32х битный тип.


Что бы перенести логику в файл.cpp, нужно сделать обычную (нешаблонную) функцию, способную принимать указатели разных типов.

Первое, что приходит в голову: передача void*, с последующей реинтерпретацией типа указателя:

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
#include <iostream>
#include <cassert>
#include <cstdint>
 
using u32_t = std::uint32_t;
 
namespace detail
{
    void foo(const void* bit32)
    {
        assert(bit32);
        const u32_t* p = static_cast<const u32_t*>(bit32);
        while(*p)
            std::cout << *p++ << " ";
        std::cout << '\n';
    }
    
} // namespace detail
 
template<class ch> void foo(const ch* bit32)
{
    static_assert(sizeof(*bit32) == 4, "expected 32 bit value");
    detail::foo(bit32);
}
 
int main()
{
    wchar_t arr[] = L"123";
    foo(arr);
}
Такой подход обладает двумя важнейшими достоинствами: простота и эффективность.
Но у него есть один фатальный недостаток: код содержит UB

Что бы устранить UB, нужно использовать что-то вроде std::bit_cast
Но тогда начинает страдать читабельность, а так же эффективность:

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
#include <iostream>
#include <cassert>
#include <cstdint>
#include <cstring>
 
using byte_t = unsigned char;
using u32_t = std::uint32_t;    
 
namespace detail
{
    void foo(const byte_t* bit32)
    {
        assert(bit32);
        u32_t val = 0;
        do
        {
            std::memcpy(&val, bit32, sizeof(u32_t));
            bit32 += sizeof(u32_t);
            if(val != 0)
                std::cout << val << " ";
        }
        while(val != 0);
        std::cout << '\n';
    }
    
} // namespace detail
 
template<class ch> void foo(const ch* bit32)
{
    static_assert(sizeof(*bit32) == 4, "expected 32 bit value");
    detail::foo(reinterpret_cast<const byte_t*>(bit32) );
}
 
int main()
{
    wchar_t arr[] = L"123";
    foo(arr);
}

Читабельность ещё можно более менее сохранить за счет вспомогательных инструментов.

Например

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
#include <iostream>
#include <cassert>
#include <cstdint>
#include <cstring>
 
#if defined (_MSC_VER) && _MSC_VER <= 1800                    // msvc[old: 2013]
    #define noexcept throw()
#endif
 
namespace experiment
{
    typedef unsigned char byte_t;
 
    template<class elem> struct sequence 
    {
        struct element
        {
            element(byte_t* data) noexcept
                : m_cur(data)
            {}
 
            operator elem() const
            {
                elem val = 0;
                std::memcpy(&val, this->m_cur, sizeof(elem));
                return val;
            }
 
            void operator+=(const elem& val)
            {
                elem cur = *this;
                cur += val;
                this->operator=(cur);
            }
 
            element& operator++() // ++it
            {
                elem cur = *this;
                ++cur;
                this->operator=(cur);
                return *this;
            }
 
            element operator++(int) // it++
            {
                const element temp(*this);
                ++(*this);
                return temp;
            }
 
            element& operator=(const elem& val)
            {
                assert(this->m_cur);
                std::memcpy(this->m_cur, &val, sizeof(elem));
                return *this;
            }
            byte_t* m_cur;
        };
 
        struct iterator
        {
            iterator(byte_t* data) noexcept
                : m_cur(data)
            {}
            
            iterator& operator++() // ++it
            {
                this->m_cur += sizeof(elem); 
                return *this;
            }
        
            bool operator==(const iterator& iter) const noexcept
            {
                return this->m_cur == iter.m_cur;
            }
            
            bool operator!=(const iterator& iter) const noexcept
            {
                return this->m_cur != iter.m_cur;
            }
        
            element operator*() const noexcept
            {
                assert(this->m_cur);
                return element(this->m_cur);
            }
        private:        
            byte_t* m_cur;
        };
 
        template<class t> sequence(t* data) noexcept
            : m_beg()
            , m_end()
        {
            assert(data);
            static_assert(sizeof(t) == sizeof(elem), "invalid size");
            this->m_beg = reinterpret_cast<byte_t*>(data);
            while(*data)
                ++data;
            this->m_end = reinterpret_cast<byte_t*>(data);
        }
 
        sequence(byte_t* data) noexcept
            : m_beg(data)
            , m_end(data)
        {
            assert(data);
            while(*this->m_end)
                ++this->m_end;
        }
        
        iterator begin() const noexcept
        {
            return iterator(this->m_beg);
        }
 
        iterator end() const noexcept
        {
            return iterator(this->m_end);
        }
        
    private:        
        byte_t* m_beg;
        byte_t* m_end;
    };
 
} // namespace experiment
 
using sequence16_t = experiment::sequence<std::uint32_t>;
 
void foo(const sequence16_t& sequence)
{
    for(const auto elem: sequence)
    std::cout << elem << " ";
        std::cout << '\n';
}
    
int main()
{
    wchar_t arr1[] = L"123";
    std::uint32_t arr2[] = { 49, 50, 51, 0};
    foo(arr1);
    foo(arr2);
}


Однако с эффективностью беда: memcpy на каждой итерации.
А если надо будет изменить значение элемента, тогда нужно будет делать ещё одно memcpy.

Можно попробовать выкрутиться за счет type erasure, но в таком варианте эффективность так же пострадает, из-за использования полиморфизма.
type erasure

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
#include <iostream>
#include <cassert>
#include <cstdint>
#include <string>
 
#ifdef __GNUC__
    #pragma GCC diagnostic push
    #pragma GCC diagnostic ignored "-Wnon-virtual-dtor"
#endif
 
#if defined (_MSC_VER) && _MSC_VER <= 1800                    // msvc[old: 2013]
    #define noexcept throw()
#endif
 
 
namespace experiment
{
    template<class ret> struct base
    {
        virtual ret operator[](const size_t index) const = 0;
        virtual void set(const size_t index, const ret&) const = 0;
    
    };
 
    template<class t, class ret> struct sequence : base<ret>
    {
        sequence(t* data) noexcept: 
            m_data(data)
        {}
 
        virtual ret operator[](const size_t index) const
        {
            return static_cast<ret>(this->m_data[index]);
        }
 
        virtual void set(const size_t index, const ret& val) const
        {
            this->m_data[index] = val;
        }
 
        t* m_data;
    };
 
} // namespace experiment
 
#ifdef __GNUC__
    #pragma GCC diagnostic pop
#endif
 
 
void bar(const experiment::base<std::uint16_t>& p)
{
    for(size_t i = 0; p[i]; ++i)
    {
        std::uint16_t v = p[i];
        std::cout << p[i] << ", ";
        p.set(i, ++v);
    }
    std::cout << '\n';
}
 
template<class ch> void foo(ch* p)
{
    bar(experiment::sequence<ch, std::uint16_t>(p));
}
 
int main()
{
    const std::wstring etalon = L"234";
    wchar_t result[] = L"123";
    foo(result);
    assert(result == etalon);
}


Для новых компиляторов можно выкрутиться за счет std::launder, а лучше сразу std::start_lifetime_as
Потому что у std::launder тоже есть какие то проблемы.
И, кстати, я так и не поняла, с чем связанно UB ?

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
#include <complex>
#include <iostream>
#include <memory>
 
int main()
{
    alignas(std::complex<float>) unsigned char network_data[sizeof(std::complex<float>)]
    {
        0xcd, 0xcc, 0xcc, 0x3d, 0xcd, 0xcc, 0x4c, 0x3e
    };
 
 
//  auto d1 = *std::launder(reinterpret_cast<std::complex<float>*>(network_data));
//  std::cout << d1 << '\n'; // UB: implicitly created objects have dynamic storage
//                                  duration and have indeterminate value initially,
//                                  even when an array which provides storage for
//                                  them has determinate bytes.
//                                  See also CWG2721.
 
    auto d2 = *std::start_lifetime_as<std::complex<float>>(network_data);
    std::cout << d2 << '\n'; // OK
}
Причем тут CWG2721, я тоже не поняла.


Итого, у меня 3 вопроса:
1) С чем связанно UB в примере использования std::launder?
2) Как грамотно решить задачу для старых компиляторов (c++98) ?
3) Как грамотно решить задачу для новых компиляторов?

Приведите, пожалуйста, код решения.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
19.10.2025, 06:21
Ответы с готовыми решениями:

Union, new placement, strict-aliasing, cross-platform
Доброго времени суток. Ниже представленный код вроде бы работает. Гонял его на компиляторах...

Каламбур типизации и strict aliasing
Есть ли какой-то стандартный способ обойти strict aliasing, с гарантией от UB? Конкретная задача:...

Strict aliasing и memcpy
Что-то я никак не врублюсь, как согласуются между собой strict aliasing и функции жонглирующие...

4
фрилансер
 Аватар для Алексей1153
6450 / 5651 / 1129
Регистрация: 11.10.2019
Сообщений: 15,046
19.10.2025, 09:05
Цитата Сообщение от eva2326 Посмотреть сообщение
Однако с эффективностью беда: memcpy на каждой итерации.
для фундаментальных типов std::memcpy компилятор обычно не вызывает как функцию, так что с эффективностью тут не должно быть проблем:

https://godbolt.org/z/rjenPs9dY

std::memcpy(&val, bit32, sizeof(u32_t));

mov rax, QWORD PTR [rbp-24]
mov eax, DWORD PTR [rax]
mov DWORD PTR [rbp-4], eax



----------

А насчёт void*. Я почему-то считал, что это тоже исключение для strict aliasing
Ведь и функции есть, которые его принимают - qsort, memcpy и так далее
2
97 / 73 / 27
Регистрация: 30.03.2023
Сообщений: 201
20.10.2025, 13:55
Насколько я понимаю, решается это вопрос примерно так:
If a program attempts to access the stored value of an object through a glvalue
Но void* не используется для доступа к памяти, поэтому на него это правило не распространяется.
А вот на полученное тобой p:
C++
1
const u32_t* p = static_cast<const u32_t*>(bit32);
уже будет распространяться.
0
1967 / 823 / 114
Регистрация: 01.10.2012
Сообщений: 4,830
Записей в блоге: 2
21.10.2025, 01:22
Цитата Сообщение от eva2326 Посмотреть сообщение
Но у него есть один фатальный недостаток: код содержит UB
Не постесняюсь спросить: а чего (или где) он его содержит? Лично я никакого UB не вижу. А "потерял нить" я еще раньше
Цитата Сообщение от eva2326 Посмотреть сообщение
Что бы перенести логику в файл.cpp, нужно сделать обычную (нешаблонную) функцию, способную принимать указатели разных типов.
Зачем же делать темплейт чтобы потом обходиться без него?
0
Вездепух
Эксперт CЭксперт С++
 Аватар для TheCalligrapher
12932 / 6800 / 1820
Регистрация: 18.10.2014
Сообщений: 17,211
21.10.2025, 09:30
Цитата Сообщение от Алексей1153 Посмотреть сообщение
А насчёт void*. Я почему-то считал, что это тоже исключение для strict aliasing
В смысле "тоже"? Исключением из strict aliasing является тип указуемых данных, а не тип указателя. В частности, переинтерпретация указуемых данных как массива типа char является исключением. А через какой промежуточный тип указателя это сделано - не имеет значения.

Цитата Сообщение от Алексей1153 Посмотреть сообщение
Ведь и функции есть, которые его принимают - qsort, memcpy и так далее
Эти функции внутри переинтерпретируют указуемые данные именно как массив char. А то, что указатель на входе был void * ни на что здесь не влияет.

Добавлено через 6 минут
Цитата Сообщение от Igor3D Посмотреть сообщение
Зачем же делать темплейт чтобы потом обходиться без него?
Во-первых, темплейт зачастую делают лишь для контроля корректности типов на уровне интерфейса. А затем на уровне реализации "обходятся без него", делегируя вызов из тонкой темплейтной оболочки в одну и ту же нетемплейтную функцию, построенную на базе void *. Это делается из старых как мир соображений: сокрытие реализации и избежание разбухания кода.

Во-вторых, все назначение темплейтных примитивов, выполняющих type erasure (например, std::function<>), как раз и сводится к тому, чтобы "написать темплейт", который "вберет в себя" всю темплейтность и тем самым позволит нам устранить (или уменьшить) темплейтность окружающего кода. Для достижения тех же целей: сокрытие реализации и избежание разбухания кода.
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
21.10.2025, 09:30
Помогаю со студенческими работами здесь

dereferencing type-punned pointer will break strict-aliasing rules
Есть кусок кода: void ReadInitialSettings(Settings &amp;mysettings) { for (uint16_t i = 0; i &lt;...

strict aliasing and custom structure
Добрый день. Классический пример, который наглядно показывает что такое strict aliasing,...

strict c++ : 64 bit int
strict c++ : 64 bit int как можно задать 64 битную целую переменную? желательно без...

Не могу дальше писать программу из-за того что не могу, не умею писать БД
Здравствуйте помогите написать БД. Я создаю программу, которая будет работать с данными!...

Помогите писать на С++ через шаблоны. Консуле я писал, но надо писать исползуя шаблоны
В одномерном массиве, состоящем из п вещественных элементов, вычислить: 1) количество элементов...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит переходные токи и напряжения на элементах схемы. . . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru