Форум программистов, компьютерный форум, киберфорум
C++
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/1: Рейтинг темы: голосов - 1, средняя оценка - 5.00
 Аватар для eva2326
1673 / 501 / 107
Регистрация: 17.05.2015
Сообщений: 1,519

Strict aliasing вынуждает писать неэффективный код

19.10.2025, 06:21. Показов 5431. Ответов 4

Студворк — интернет-сервис помощи студентам
Всем привет.

Есть шаблон функции, логику которой нужно перенести в файл.cpp

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
#include <iostream>
#include <cassert>
#include <cstring>
 
using u32_t = std::uint32_t;
 
template<class ch> void foo(const ch* bit32)
{
    assert(bit32);
    static_assert(sizeof(bit32[0]) == 4, "expected 32 bit value");
    while(*bit32)
        std::cout << static_cast<u32_t>(*bit32++) << " ";
    std::cout << '\n';
}
 
int main()
{
    wchar_t arr[] = L"123";
    foo(arr);
}
Указатели, с которыми работает шаблон, представляют числовые последовательности.
В данном примере ожидается последовательность 32 битных чисел.
Тип числа можно быть, например std::uint32_t, или например wchar_t (на линукс платформах)
Или char32_t, в общем - любой числовой 32х битный тип.


Что бы перенести логику в файл.cpp, нужно сделать обычную (нешаблонную) функцию, способную принимать указатели разных типов.

Первое, что приходит в голову: передача void*, с последующей реинтерпретацией типа указателя:

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
#include <iostream>
#include <cassert>
#include <cstdint>
 
using u32_t = std::uint32_t;
 
namespace detail
{
    void foo(const void* bit32)
    {
        assert(bit32);
        const u32_t* p = static_cast<const u32_t*>(bit32);
        while(*p)
            std::cout << *p++ << " ";
        std::cout << '\n';
    }
    
} // namespace detail
 
template<class ch> void foo(const ch* bit32)
{
    static_assert(sizeof(*bit32) == 4, "expected 32 bit value");
    detail::foo(bit32);
}
 
int main()
{
    wchar_t arr[] = L"123";
    foo(arr);
}
Такой подход обладает двумя важнейшими достоинствами: простота и эффективность.
Но у него есть один фатальный недостаток: код содержит UB

Что бы устранить UB, нужно использовать что-то вроде std::bit_cast
Но тогда начинает страдать читабельность, а так же эффективность:

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
#include <iostream>
#include <cassert>
#include <cstdint>
#include <cstring>
 
using byte_t = unsigned char;
using u32_t = std::uint32_t;    
 
namespace detail
{
    void foo(const byte_t* bit32)
    {
        assert(bit32);
        u32_t val = 0;
        do
        {
            std::memcpy(&val, bit32, sizeof(u32_t));
            bit32 += sizeof(u32_t);
            if(val != 0)
                std::cout << val << " ";
        }
        while(val != 0);
        std::cout << '\n';
    }
    
} // namespace detail
 
template<class ch> void foo(const ch* bit32)
{
    static_assert(sizeof(*bit32) == 4, "expected 32 bit value");
    detail::foo(reinterpret_cast<const byte_t*>(bit32) );
}
 
int main()
{
    wchar_t arr[] = L"123";
    foo(arr);
}

Читабельность ещё можно более менее сохранить за счет вспомогательных инструментов.

Например

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
#include <iostream>
#include <cassert>
#include <cstdint>
#include <cstring>
 
#if defined (_MSC_VER) && _MSC_VER <= 1800                    // msvc[old: 2013]
    #define noexcept throw()
#endif
 
namespace experiment
{
    typedef unsigned char byte_t;
 
    template<class elem> struct sequence 
    {
        struct element
        {
            element(byte_t* data) noexcept
                : m_cur(data)
            {}
 
            operator elem() const
            {
                elem val = 0;
                std::memcpy(&val, this->m_cur, sizeof(elem));
                return val;
            }
 
            void operator+=(const elem& val)
            {
                elem cur = *this;
                cur += val;
                this->operator=(cur);
            }
 
            element& operator++() // ++it
            {
                elem cur = *this;
                ++cur;
                this->operator=(cur);
                return *this;
            }
 
            element operator++(int) // it++
            {
                const element temp(*this);
                ++(*this);
                return temp;
            }
 
            element& operator=(const elem& val)
            {
                assert(this->m_cur);
                std::memcpy(this->m_cur, &val, sizeof(elem));
                return *this;
            }
            byte_t* m_cur;
        };
 
        struct iterator
        {
            iterator(byte_t* data) noexcept
                : m_cur(data)
            {}
            
            iterator& operator++() // ++it
            {
                this->m_cur += sizeof(elem); 
                return *this;
            }
        
            bool operator==(const iterator& iter) const noexcept
            {
                return this->m_cur == iter.m_cur;
            }
            
            bool operator!=(const iterator& iter) const noexcept
            {
                return this->m_cur != iter.m_cur;
            }
        
            element operator*() const noexcept
            {
                assert(this->m_cur);
                return element(this->m_cur);
            }
        private:        
            byte_t* m_cur;
        };
 
        template<class t> sequence(t* data) noexcept
            : m_beg()
            , m_end()
        {
            assert(data);
            static_assert(sizeof(t) == sizeof(elem), "invalid size");
            this->m_beg = reinterpret_cast<byte_t*>(data);
            while(*data)
                ++data;
            this->m_end = reinterpret_cast<byte_t*>(data);
        }
 
        sequence(byte_t* data) noexcept
            : m_beg(data)
            , m_end(data)
        {
            assert(data);
            while(*this->m_end)
                ++this->m_end;
        }
        
        iterator begin() const noexcept
        {
            return iterator(this->m_beg);
        }
 
        iterator end() const noexcept
        {
            return iterator(this->m_end);
        }
        
    private:        
        byte_t* m_beg;
        byte_t* m_end;
    };
 
} // namespace experiment
 
using sequence16_t = experiment::sequence<std::uint32_t>;
 
void foo(const sequence16_t& sequence)
{
    for(const auto elem: sequence)
    std::cout << elem << " ";
        std::cout << '\n';
}
    
int main()
{
    wchar_t arr1[] = L"123";
    std::uint32_t arr2[] = { 49, 50, 51, 0};
    foo(arr1);
    foo(arr2);
}


Однако с эффективностью беда: memcpy на каждой итерации.
А если надо будет изменить значение элемента, тогда нужно будет делать ещё одно memcpy.

Можно попробовать выкрутиться за счет type erasure, но в таком варианте эффективность так же пострадает, из-за использования полиморфизма.
type erasure

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
#include <iostream>
#include <cassert>
#include <cstdint>
#include <string>
 
#ifdef __GNUC__
    #pragma GCC diagnostic push
    #pragma GCC diagnostic ignored "-Wnon-virtual-dtor"
#endif
 
#if defined (_MSC_VER) && _MSC_VER <= 1800                    // msvc[old: 2013]
    #define noexcept throw()
#endif
 
 
namespace experiment
{
    template<class ret> struct base
    {
        virtual ret operator[](const size_t index) const = 0;
        virtual void set(const size_t index, const ret&) const = 0;
    
    };
 
    template<class t, class ret> struct sequence : base<ret>
    {
        sequence(t* data) noexcept: 
            m_data(data)
        {}
 
        virtual ret operator[](const size_t index) const
        {
            return static_cast<ret>(this->m_data[index]);
        }
 
        virtual void set(const size_t index, const ret& val) const
        {
            this->m_data[index] = val;
        }
 
        t* m_data;
    };
 
} // namespace experiment
 
#ifdef __GNUC__
    #pragma GCC diagnostic pop
#endif
 
 
void bar(const experiment::base<std::uint16_t>& p)
{
    for(size_t i = 0; p[i]; ++i)
    {
        std::uint16_t v = p[i];
        std::cout << p[i] << ", ";
        p.set(i, ++v);
    }
    std::cout << '\n';
}
 
template<class ch> void foo(ch* p)
{
    bar(experiment::sequence<ch, std::uint16_t>(p));
}
 
int main()
{
    const std::wstring etalon = L"234";
    wchar_t result[] = L"123";
    foo(result);
    assert(result == etalon);
}


Для новых компиляторов можно выкрутиться за счет std::launder, а лучше сразу std::start_lifetime_as
Потому что у std::launder тоже есть какие то проблемы.
И, кстати, я так и не поняла, с чем связанно UB ?

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
#include <complex>
#include <iostream>
#include <memory>
 
int main()
{
    alignas(std::complex<float>) unsigned char network_data[sizeof(std::complex<float>)]
    {
        0xcd, 0xcc, 0xcc, 0x3d, 0xcd, 0xcc, 0x4c, 0x3e
    };
 
 
//  auto d1 = *std::launder(reinterpret_cast<std::complex<float>*>(network_data));
//  std::cout << d1 << '\n'; // UB: implicitly created objects have dynamic storage
//                                  duration and have indeterminate value initially,
//                                  even when an array which provides storage for
//                                  them has determinate bytes.
//                                  See also CWG2721.
 
    auto d2 = *std::start_lifetime_as<std::complex<float>>(network_data);
    std::cout << d2 << '\n'; // OK
}
Причем тут CWG2721, я тоже не поняла.


Итого, у меня 3 вопроса:
1) С чем связанно UB в примере использования std::launder?
2) Как грамотно решить задачу для старых компиляторов (c++98) ?
3) Как грамотно решить задачу для новых компиляторов?

Приведите, пожалуйста, код решения.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
19.10.2025, 06:21
Ответы с готовыми решениями:

Union, new placement, strict-aliasing, cross-platform
Доброго времени суток. Ниже представленный код вроде бы работает. Гонял его на компиляторах...

Каламбур типизации и strict aliasing
Есть ли какой-то стандартный способ обойти strict aliasing, с гарантией от UB? Конкретная задача:...

Strict aliasing и memcpy
Что-то я никак не врублюсь, как согласуются между собой strict aliasing и функции жонглирующие...

4
фрилансер
 Аватар для Алексей1153
6466 / 5688 / 1131
Регистрация: 11.10.2019
Сообщений: 15,143
19.10.2025, 09:05
Цитата Сообщение от eva2326 Посмотреть сообщение
Однако с эффективностью беда: memcpy на каждой итерации.
для фундаментальных типов std::memcpy компилятор обычно не вызывает как функцию, так что с эффективностью тут не должно быть проблем:

https://godbolt.org/z/rjenPs9dY

std::memcpy(&val, bit32, sizeof(u32_t));

mov rax, QWORD PTR [rbp-24]
mov eax, DWORD PTR [rax]
mov DWORD PTR [rbp-4], eax



----------

А насчёт void*. Я почему-то считал, что это тоже исключение для strict aliasing
Ведь и функции есть, которые его принимают - qsort, memcpy и так далее
2
99 / 74 / 28
Регистрация: 30.03.2023
Сообщений: 206
20.10.2025, 13:55
Насколько я понимаю, решается это вопрос примерно так:
If a program attempts to access the stored value of an object through a glvalue
Но void* не используется для доступа к памяти, поэтому на него это правило не распространяется.
А вот на полученное тобой p:
C++
1
const u32_t* p = static_cast<const u32_t*>(bit32);
уже будет распространяться.
0
1972 / 828 / 115
Регистрация: 01.10.2012
Сообщений: 4,977
Записей в блоге: 2
21.10.2025, 01:22
Цитата Сообщение от eva2326 Посмотреть сообщение
Но у него есть один фатальный недостаток: код содержит UB
Не постесняюсь спросить: а чего (или где) он его содержит? Лично я никакого UB не вижу. А "потерял нить" я еще раньше
Цитата Сообщение от eva2326 Посмотреть сообщение
Что бы перенести логику в файл.cpp, нужно сделать обычную (нешаблонную) функцию, способную принимать указатели разных типов.
Зачем же делать темплейт чтобы потом обходиться без него?
0
Вездепух
Эксперт CЭксперт С++
 Аватар для TheCalligrapher
13183 / 6819 / 1821
Регистрация: 18.10.2014
Сообщений: 17,260
21.10.2025, 09:30
Цитата Сообщение от Алексей1153 Посмотреть сообщение
А насчёт void*. Я почему-то считал, что это тоже исключение для strict aliasing
В смысле "тоже"? Исключением из strict aliasing является тип указуемых данных, а не тип указателя. В частности, переинтерпретация указуемых данных как массива типа char является исключением. А через какой промежуточный тип указателя это сделано - не имеет значения.

Цитата Сообщение от Алексей1153 Посмотреть сообщение
Ведь и функции есть, которые его принимают - qsort, memcpy и так далее
Эти функции внутри переинтерпретируют указуемые данные именно как массив char. А то, что указатель на входе был void * ни на что здесь не влияет.

Добавлено через 6 минут
Цитата Сообщение от Igor3D Посмотреть сообщение
Зачем же делать темплейт чтобы потом обходиться без него?
Во-первых, темплейт зачастую делают лишь для контроля корректности типов на уровне интерфейса. А затем на уровне реализации "обходятся без него", делегируя вызов из тонкой темплейтной оболочки в одну и ту же нетемплейтную функцию, построенную на базе void *. Это делается из старых как мир соображений: сокрытие реализации и избежание разбухания кода.

Во-вторых, все назначение темплейтных примитивов, выполняющих type erasure (например, std::function<>), как раз и сводится к тому, чтобы "написать темплейт", который "вберет в себя" всю темплейтность и тем самым позволит нам устранить (или уменьшить) темплейтность окружающего кода. Для достижения тех же целей: сокрытие реализации и избежание разбухания кода.
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
21.10.2025, 09:30
Помогаю со студенческими работами здесь

dereferencing type-punned pointer will break strict-aliasing rules
Есть кусок кода: void ReadInitialSettings(Settings &amp;mysettings) { for (uint16_t i = 0; i &lt;...

strict aliasing and custom structure
Добрый день. Классический пример, который наглядно показывает что такое strict aliasing,...

strict c++ : 64 bit int
strict c++ : 64 bit int как можно задать 64 битную целую переменную? желательно без...

Не могу дальше писать программу из-за того что не могу, не умею писать БД
Здравствуйте помогите написать БД. Я создаю программу, которая будет работать с данными!...

Помогите писать на С++ через шаблоны. Консуле я писал, но надо писать исползуя шаблоны
В одномерном массиве, состоящем из п вещественных элементов, вычислить: 1) количество элементов...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
Доступность команды формы по условию
Maks 07.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: сделать доступной кнопку (команда формы "ЗавершитьСписание") при. . .
Уведомление о неверно выбранном значении справочника
Maks 06.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "НарядПутевка", разработанного в конфигурации КА2. Задача: уведомлять пользователя, если в документе выбран неверный склад. . .
Установка Qt Creator для C и C++: ставим среду, CMake и MinGW без фреймворка Qt
8Observer8 05.04.2026
Среду разработки Qt Creator можно установить без фреймворка Qt. Есть отдельный репозиторий для этой среды: https:/ / github. com/ qt-creator/ qt-creator, где можно скачать установщик, на вкладке Releases:. . .
AkelPad-скрипты, структуры, и немного лирики..
testuser2 05.04.2026
Такая программа, как AkelPad существует уже давно, и также давно существуют скрипты под нее. Тем не менее, прога живет, периодически что-то не спеша дополняется, улучшается. Что меня в первую очередь. . .
Отображение реквизитов в документе по условию и контроль их заполнения
Maks 04.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеСпецтехники", разработанного в конфигурации КА2. Данный документ берёт данные из другого нетипового документа. . .
Фото всей Земли с борта корабля Orion миссии Artemis II
kumehtar 04.04.2026
Это первое подобное фото сделанное человеком за 50 лет. Снимок называют новым вариантом легендарной фотографии «The Blue Marble» 1972 года, сделанной с борта корабля «Аполлон-17». Новое фото. . .
Вывод диалогового окна перед закрытием, если документ не проведён
Maks 04.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: реализовать программный контроль на предмет проведения документа. . .
Программный контроль заполнения реквизитов табличной части документа
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: 1. Реализовать контроль заполнения реквизита. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru