Форум программистов, компьютерный форум, киберфорум
Visual C++
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.89/9: Рейтинг темы: голосов - 9, средняя оценка - 4.89
0 / 0 / 0
Регистрация: 31.03.2016
Сообщений: 7

MSVC 2015 оптимизация в компиляторе

31.03.2016, 16:03. Показов 2006. Ответов 11
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Проблема такая: написал программу в Dev-C++, отладил, накрутил оптимизацию, все дела. Время исполнения получилось 0.7 секунд.
Переношу ее в Visual Studio, воюю с компилятором, ставлю релиз. Время исполнения - 3 секунды.
Вопрос: как можно настроить оптимизацию в студии, чтобы было хотя бы не хуже GCC?
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
31.03.2016, 16:03
Ответы с готовыми решениями:

Статическая сборка QT 5.7.0 c MSVC-2015
Добрый день. Собрал QT 5.7.0 в соответствие с описанием по ссылке...

Почему в MSVC++ 2008 компилируется, а в MSVC++ 2010 вылезает много ошибок?
Кстати, перед запуском в 2010 предлагает конвертировать код. Ну а чем эти две студии отличаются, что вызывает большое количество ошибок?

Типы оптимизация: черная оптимизация, серая оптимизация и белая оптимизация
Много много лет назад, на заре становления профессии "оптимизатора" в какой то умной книжке был создан миф. Это миф о цветовой индефикации...

11
Ушел с форума
Эксперт С++
 Аватар для Убежденный
16481 / 7444 / 1187
Регистрация: 02.05.2013
Сообщений: 11,616
Записей в блоге: 1
31.03.2016, 17:53
Компиляция в режиме 'Release'.
Настройки проекта, раздел C++ / Optimization, включаешь все на максимум.
При желании можно еще использовать PGO.
0
0 / 0 / 0
Регистрация: 31.03.2016
Сообщений: 7
31.03.2016, 18:35  [ТС]
Цитата Сообщение от Убежденный Посмотреть сообщение
Компиляция в режиме 'Release'.
Настройки проекта, раздел C++ / Optimization, включаешь все на максимум.
При желании можно еще использовать PGO.
Вроде все натыкал, ноль реакции, те же 2.9 сек. Скрин сделал.
Вообще реально то, чего я хочу? Чтобы VS мне скомпилировал хотя бы так же, как и ГЦЦ.

PGO - это что за зверь?
Миниатюры
MSVC 2015 оптимизация в компиляторе  
0
Ушел с форума
Эксперт С++
 Аватар для Убежденный
16481 / 7444 / 1187
Регистрация: 02.05.2013
Сообщений: 11,616
Записей в блоге: 1
31.03.2016, 18:39
Исходники этой чудо-программы глянуть бы...
PGO - Profile-Guided Optimization. Программа оптимизируется в два прохода:
на первом выполняется сбор информации (например, о тех местах, которые
выполняются чаще всего и занимают больше всего времени), на втором
уже выполняется оптимизация с учетом этой информации.
0
0 / 0 / 0
Регистрация: 31.03.2016
Сообщений: 7
01.04.2016, 02:00  [ТС]
Цитата Сообщение от Убежденный Посмотреть сообщение
Исходники этой чудо-программы глянуть бы...
PGO - Profile-Guided Optimization. Программа оптимизируется в два прохода:
на первом выполняется сбор информации (например, о тех местах, которые
выполняются чаще всего и занимают больше всего времени), на втором
уже выполняется оптимизация с учетом этой информации.
Да исходники не проблема, ничего секретного там и близко нет. Могу сюда кинуть, могу на гитхаб ссылку дать.

Блин, забыл сказать. Студио ругалась на функцию fopen и сказала заменить на fopen_s, что я и сделал. Все, больше ничего не менял после Дев-С++.

Добавлено через 7 часов 17 минут
Вот код:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
#include <fstream>
#include <iostream>
#include <time.h>
#include "windows.h"
using namespace std;
 
//this program is a poker hand evaluator test
//there is EvalF() function which takes 7 cards as numbers from 0 to 51 and returns a number from 1 to 4824. Lets call it equivalence class or EQ. The less the number the better the hand.
//so the speed test here is enumeration through all possible C(52,7)=~134M possible combinations of 7-card poker hands
//the main work is done here in this loop of 134M iterations
#define LOOP_7_CARDS(X) for (c1 = 0; c1 < 52; c1++) {      \
                        for (c2 = c1+1; c2 < 52; c2++) {    \
                        for (c3 = c2+1; c3 < 52; c3++) {    \
                        for (c4 = c3+1; c4 < 52; c4++) {    \
                        for (c5 = c4+1; c5 < 52; c5++) {    \
                        for (c6 = c5+1; c6 < 52; c6++) {    \
                        for (c7 = c6+1; c7 < 52; c7++) {    \
                            (X);}}}}}}}                 \
//these are for processing of results
//names of poker combinations
    const char* HandRanks[]={
    "High Card =        ",
    "One Pair =         ",
    "Two Pairs =        ",
    "Three of a Kind =  ",
    "Straight =         ",
    "Flushes =          ",
    "Fullhouse =        ",
    "Four of a Kind =   ",
    "Straight Flush =   "};
 
    int IDcount[4825] = {0};//counts how many times we had specific EQ, like IDcount[EQ]++
    int _count[10] = {0};//counter for combinations
    int total = 0;       //total hands evaluated
    int c1, c2, c3, c4, c5, c6,c7; //cards
    __int64 clocksused; //variables for timings
    clock_t timer;
    LARGE_INTEGER timings, endtimings;
 
void start_clock(){
        clock_t timer = clock();    // start regular clock
        QueryPerformanceCounter(&timings);   // start High Precision clock
    }
 
void stop_clock(){
    QueryPerformanceCounter(&endtimings);  // end the high precision clock
    timer = clock() - timer;                  // end the regular clock
    clocksused = (__int64)endtimings.QuadPart - (__int64) timings.QuadPart;
    }
//transforms EQ counter IDcount[] into human readable combination counter _count[],
// so abbreviations stand for poker combinations like high card, one pair, two pair, etc.
void check_sum () {
    for(int i = 1; i < 11; i++)        _count[8]+=IDcount[i]; //SF
    for(int i = 11; i < 167; i++)      _count[7]+=IDcount[i]; //FK  
    for(int i = 167; i < 323; i++)     _count[6]+=IDcount[i]; //FH  
    for(int i = 323; i < 1600; i++)    _count[5]+=IDcount[i]; //FL  
    for(int i = 1600; i < 1610; i++)   _count[4]+=IDcount[i]; //ST  
    for(int i = 1610; i < 2185; i++)   _count[3]+=IDcount[i]; //TK  
    for(int i = 2185; i < 2948; i++)   _count[2]+=IDcount[i]; //TP  
    for(int i = 2948; i < 4418; i++)   _count[1]+=IDcount[i]; //OP  
    for(int i = 4418; i < 4825; i++)   _count[0]+=IDcount[i]; //HC  
}
 
void validation_time (){
    printf("\nValidation seconds = %.4lf\nTotal HighPrecision Clocks = %I64d\nHighPrecision clocks per lookup = %lf\n", (double)timer/CLOCKS_PER_SEC, clocksused, (double) clocksused /  133784.560) ;
}   
// display results
void results () {
    check_sum();
    for(int i = 0; i < 9; i++) {
        cout << HandRanks[i]<<_count[i]<<endl;
        total+=_count[i];
    }
    cout << "Total =            " << total;
    validation_time ();
}
//macro for reading binary file with lookup tables
#define INIT_HR {if (!initHR()){  printf("Problem Opening HRLUTfinal.dat\n");return 0;}}
#define ULL long long   
    //lookup tables
    short EL0[13];
    short EL1[13][13];
    short EL2[91][13];
    short EL3[455][13];
    short EL4[1820][13];
    short EL5[6188][13];
    short EL6[18564][13];
    short flushes[8192];
 
    ULL  hand, //given hand
         x=1;   //64bit 1
//this function reads lookup tables from binary file and puts them to EL0...EL6 arrays
int initHR (){
    errno_t err;
    FILE * f1;
    err = fopen_s(&f1, "HRLUTfinal.dat", "rb");
 
    if (!f1) {                                    
        printf("Problem Opening HRLUTfinal.dat\n");
        return 0;
    }
 
    size_t   read_lut = fread(EL0, sizeof(EL0), 1, f1);
             read_lut = fread(EL1, sizeof(EL1), 1, f1);
             read_lut = fread(EL2, sizeof(EL2), 1, f1);
             read_lut = fread(EL3, sizeof(EL3), 1, f1);
             read_lut = fread(EL4, sizeof(EL4), 1, f1);
             read_lut = fread(EL5, sizeof(EL5), 1, f1);
             read_lut = fread(EL6, sizeof(EL6), 1, f1);
             read_lut = fread(flushes,sizeof(flushes),1,f1);
 
    fclose(f1);
    return 1;
}
//this function returns a value for a 7 card hand as if no suits exist which is most common case in poker
    inline short HRoffsuit (short c1, short c2, short c3, short c4, short c5, short c6, short c7){ 
        return EL6[EL5[EL4[EL3[EL2[EL1[EL0[c1%13]][c2%13]][c3%13]][c4%13]][c5%13]][c6%13]][c7%13]; 
    }
 
    inline short EvalF (short c1, short c2, short c3, short c4, short c5, int c6, short c7){
        hand=(x<<c1)|(x<<c2)|(x<<c3)|(x<<c4)|(x<<c5)|(x<<c6)|(x<<c7);//add cards to 52-bit mask
        short m,n;
        m= flushes[hand&0x1fff]|flushes[(hand>>13)&0x1fff]|        //split 52-bit mask into 13-bit pieces for each suit
            flushes[(hand>>26)&0x1fff]|flushes[(hand>>39)&0x1fff];//and use each piece as index to flushes array
    n=  HRoffsuit(c1,c2,c3,c4,c5,c6,c7);                     //comb trough tables having ranks only disregarding suits
    if (!m) m=n;                                            //if no flush detected then return our second value 
        return m;
    }
//main function is pretty much pseudocode   
int main(){
 
    //read lookup table from .DAT file
    INIT_HR;
 
    start_clock();
 
    LOOP_7_CARDS(IDcount[EvalF(c1,c2,c3,c4,c5,c6,c7)]++);
 
    stop_clock();
 
    // display results
    results();
    system("pause");
    return 0;
 
}
0
Ушел с форума
Эксперт С++
 Аватар для Убежденный
16481 / 7444 / 1187
Регистрация: 02.05.2013
Сообщений: 11,616
Записей в блоге: 1
01.04.2016, 08:35
Ок. Для полноты не хватает только файла HRLUTfinal.dat.
0
0 / 0 / 0
Регистрация: 31.03.2016
Сообщений: 7
01.04.2016, 08:41  [ТС]
https://github.com/RICHnsk/Pok... b/master/H
Вот этот бинарник. Просто переименовать.
0
Ушел с форума
Эксперт С++
 Аватар для Убежденный
16481 / 7444 / 1187
Регистрация: 02.05.2013
Сообщений: 11,616
Записей в блоге: 1
01.04.2016, 09:09
Хм, ну у меня в VS2008 скомпиленный бинарь тоже выполняется где-то 3 секунды (Core i5-2500).
Я, конечно, видел, когда GCC/MinGW генерировал более эффективный код,
чем MS C++ Compiler, но что бы сразу на порядок быстрее...
0
0 / 0 / 0
Регистрация: 31.03.2016
Сообщений: 7
01.04.2016, 09:13  [ТС]
А в gcc пробовали компилировать?
0
Ушел с форума
Эксперт С++
 Аватар для Убежденный
16481 / 7444 / 1187
Регистрация: 02.05.2013
Сообщений: 11,616
Записей в блоге: 1
01.04.2016, 09:23
GCC у меня нету. Кстати, включил PGO в VC++, выиграл еще одну секунду
0
0 / 0 / 0
Регистрация: 31.03.2016
Сообщений: 7
01.04.2016, 09:26  [ТС]
Осталось еще в три раза ускорить) Просто у меня в девс++ профилирование не работает почему-то и я решил в VS прогнать, скомпилировал и у меня челюсть отпала...
0
0 / 0 / 0
Регистрация: 31.03.2016
Сообщений: 7
02.04.2016, 22:55  [ТС]
В общем меня посетили такие мысли при профилировании в Дев-С++ и в ВС. Код от ВС обращается к функции EvalF, а код от Дев-С++ не обращается, следовательно ГЦЦ тупо инлайнит всё, что можно и разворачивает все циклы. Смотрю на размер файлов, так и есть: ГЦЦ - 1920кБ, ВС - 15кБ. Похоже вопрос закрыт.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
02.04.2016, 22:55
Помогаю со студенческими работами здесь

Install Shield 2015 и Visual Studio 2015 Community
Как в Visual Studio 2015 Community интегрировать Install Shield что можно было создавать не исполняемый файл exe а setup для дальнейшей...

QT 5.4 иероглифы в компиляторе
Запускаюсь на Вин7. Проблема с кодировкой русских символов сообщений компилятора. Вылечил заменой файла jom, но проблема вернулась...

Данные о компиляторе
Всем привет. Антивирус Clam в любой borland c++ программе пишет, что она вирус, а точнее: PUA.Win.Packer.BorlandCpp-9. То есть, я так...

Ошибка в компиляторе
Всем привет. Нужно сделать бегущего человечка, начал рисовать ноги, но в компиляторе вылезает ошибка: In file included from main.cpp. Как...

Ошибка в компиляторе
Ошибка 1 error LNK2019: ссылка на неразрешенный внешний символ _getCharacterCode в функции _change_ Как от неё избавиться?


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
12
Ответ Создать тему
Новые блоги и статьи
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора ВВЕДЕНИЕ Выполняя задание на управление насосной группой заполнения резервуара,. . .
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru