Форум программистов, компьютерный форум, киберфорум
C (Си)
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.78/9: Рейтинг темы: голосов - 9, средняя оценка - 4.78
19 / 11 / 0
Регистрация: 02.09.2010
Сообщений: 235

Расстановка restrict для применения компилятором оптимизаций, таких как векторизация

23.08.2012, 04:33. Показов 2001. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Не соображу, в каких ситуациях можно применять...
Если указатель объявлен с квалификатором restrict, то к объекту, на который он ссылается, можно обратиться только с помощью этого указателя. Обращение к объекту с помощью другого указателя возможно только в том случае, если другой указатель основан на первом. Таким образом, доступ к объекту можно получить только с помощью выражений, основанных на указателе с квалификатором restrict. Указатели restrict используются главным образом как параметры функции или совместно с malloc(). Если указатель объявлен с квалификатором restrict, компилятор способен лучше оптимизировать некоторые процедуры. Например, если два параметра функции определены как указатели с квалификатором restrict, то это сообщает компилятору о том, что они указывают на два разных (не пересекающихся) объекта, что позволяет применить векторизацию.

Проанализируем, например, то, что стало классическим примером применения restrict — определение функции memcpy(). В С89 у нее имеется следующий прототип:
C
1
void *memcpy(void *cmp1, const void *cmp2, size_t размер);
В описании memcpy() сказано, что если объекты, на которые указывают cmp1 и cmp2, перекрываются, то поведение этой функции непредсказуемое. Таким образом. memcpy() гарантированно будет работать только с неперекрывающимися объектами.

В С99 можно использовать restrict, чтобы в прототипе memcpy() явно указать то, что в С89 приходится дополнительно объяснять словами. Вот прототип memcpy() в С99:
C
1
void *memcpy(void * restrict cmp1, const void * restrict cmp2, size_t размер);
Квалифицируя cmp1 и cmp2 с помощью квалификатора типа restrict, в прототипе явно утверждается, что они указывают на неперекрывающиеся объекты.

Из-за преимуществ, которые может принести использование квалификатора типа restrict, в С99 он был добавлен в прототипы многих библиотечных функций, определенных еще в С89.
Написал несколько функций:
C
1
2
3
4
5
6
7
8
9
// bb и sb выделены в куче и не пересекаются
void cp(char bb[], const char sb[], int a)
{
    int i=0;
    while(i!=a) {
        bb[i]=sb[i];
        ++i;
    }
}
C
1
2
3
4
5
6
7
8
9
10
// bb и sb выделены в куче и не пересекаются. 
// ybb никуда не указывает
void cp(char bb[], const char sb[], char *ybb)
{
    int i=0;
    while(&(bb[i])!=ybb) {
        bb[i]=sb[i];
        ++i;
    }
}
C
1
2
3
4
5
6
7
8
9
10
11
12
13
14
// bb и sb выделены в куче и не пересекаются. 
// ybb и ysb указывают на произвольные участки bb и sb соответственно
void cp(char bb[], const char sb[], char *ybb, const  char *ysb)
{
    int i=0;
    ybb=&bb[0];
    ysb=&sb[0];
    while(i!=10) {
        *ybb=*ysb;
        ++ybb;
        ++ysb;
        ++i;
    }
}
C
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
// bb и sb выделены в куче и не пересекаются. 
// ybb и ysb указывают на произвольные участки bb и sb соответственно
void cp(char bb[], char sb[], char *ybb, char *ysb)
{
    int i=0;
    ybb=&bb[0];
    ysb=&sb[0];
    while(i!=10) {
        *ybb=*ysb;
         *ysb=*(ysb-1);
        ++ybb;
        ++ysb;
        ++i;
    }
}
C
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
// bb и sb выделены в куче и не пересекаются. 
// ybb и ysb указывают на произвольные участки bb и sb соответственно
void cp(char bb[], char sb[], char *ybb, char *ysb)
{
    int i=1;
    ybb=&bb[0];
    ysb=&sb[0];
    while(i!=10) {
        *ybb=sb[i];
        *ysb=sb[(i-1)];
        ++ybb;
        ++ysb;
        ++i;
    }
    *ybb='\0';
    *ysb='\0';
}
Понимающие принцип работы, расставьте пожалуйста restrict где надо, и поясните почему в одних случаях можно применять, а в других нельзя.
Буду благодарен, если приведете в добавок свои примеры для большей полноты раскрытия темы...
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
23.08.2012, 04:33
Ответы с готовыми решениями:

Как можно посмотреть код, генерируемый компилятором, для итераторов
как можно посмотреть этот сгенерированный код?

Как производится векторизация BITMAP?
Народ поможите! Как производится векторизация BITMAP и тому подобное.

(Для моего товарища)Скажите как сборка для таких требований?Поправте,объясните
У него очень сильно сильно старый комп,ему уже не помочь.Но он решил сменить его. Сразу говорю,что в танки он не играет и никогда не...

1
4866 / 3288 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
23.08.2012, 14:34
https://www.cyberforum.ru/post3373913.html
ни от чего не защищает он
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
23.08.2012, 14:34
Помогаю со студенческими работами здесь

Как найти причину появления сообщения с просьбой перезагрузить компьютер для применения настроек?
Ребята, подскажите, кто может. Меня уже подзадолбали вопросом, из-за чего периодически выскакивает стандартное XP сообщение с просьбой...

Нужно мнение гуру по seo-оптимизаций
Всем привет! Мой первый сайт Delay-Dengi.Net! Оптимизировал сайт читая форумы, блоги и смотря видео материалы. Сайту почти уже год, вышел в...

Restrict Categories
Подскажите, как можно ограничить доступ: Гости могут видеть только анонс рубрики. Для просмотра полного поста/страницы надо быть как...

Апгрейд ПК для таких игр как Pubg, Rust и остальные
Хочу улучшить пк что бы смог играть в такие игры Pubg,Rust и подобное вот составляющие. Системная плата MSI A68HM-E33 V2 (MS-7721) ...

настройка MinGW с компилятором только для Си
Можете поподробнее описать процесс настройки MinGW и компиляции на Си


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Символьное дифференцирование
igorrr37 13.02.2026
/ * Логарифм записывается как: (x-2)log(x^2+2) - означает логарифм (x^2+2) по основанию (x-2). Унарный минус обозначается как ! */ #include <iostream> #include <stack> #include <cctype>. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru