Уроки программинга. Урок № 6. Машина Тьюринга и КР.

Запись от CoderHuligan размещена 31.05.2019 в 16:32
Обновил(-а) CoderHuligan 01.06.2019 в 18:23

Важные замечания о машине Тьюринга.

Как хорошо известно, Алан Тьюринг, выдающийся английский математик(https://habr.com/ru/post/304244/), создал универсальную модель вычислительного устройства, так называемую, "машину Тьюринга". То есть был создан универсальный вычислитель, способны вычислить всё, что способно быть вычислимым в принципе. С тех пор данная модель считается эталоном полноты того или иного ЯП (Языка Программирования) Это называется полнотой по Тьюрингу . Машина Тьюринга (МТ) способна эмулировать любой алгоритм, любую вычислительную машину. По сути она представляет из себя частный случай конечного автомата, математическая теория которого хорошо развита. На ней можно эмулировать алгорифмы Маркова, машину Поста, любой компьютер, любой алгоритм и т.п. Всё что угодно. Более того: на этом принципе и построены процессоры компьютеров. Любая другая машина будет ограничена. Модель универсального вычислителя это основа будущего ИИ (Искуственного Интелекта), основа робототехники и пр.
К сожалению, "благодаря" революционным изменениям, которые произошли в комп-индустрии в 60-70 годы, МТ так и осталась недооценённым артефактом, чисто теоретической вещью, хотя и использовалась во время Великой Отечественной Войны в криптографии. А в практическом плане, наука программирования ещё даже не смогла осознать важность МТ, как ему уже всучили в зубы кость пожирнее, видимо для отвлечения внимания..
МТ состоит из двух основных устройств:

1) Управляющего устройства (головки считывания).
2) Бесконечной ленты с ячейками, в каждой из которых может находится одно единственное значение так называемого "входного алфавита".
До некоторой степени ленту можно сопоставить с ячейками ОЗУ компьютера.
Лента может двигаться вправо или влево или оставаться на месте (нейтральное положение). При этом головка считывания может считывать это значение, либо записывать его в ячейку. Это механическая её часть.
Работа МТ обуславливается тремя сущностями:
1) Набором значений входного алфавита конкретной МТ;
2) Набором явно заданных конечных состояний МТ;
3) Набором команд, которые специфизируют правила перехода из одного состояния в другое и действия машины в каждом конкретном состоянии.
Так как МТ это машина абстрактная, то она имеет бесконечную ленту с ячейками. В реальных вычислительных системах она конечна, так как конечна сама память машины. Однако это не приводит к каким-либо осложнениям когда мы пытаемся "натянуть" на реальный вычислитель, абстракцию в виде МТ.
Алгоритм работы задаётся таблицей, в которой ряды задаются отдельными значениями алфавита, а колонки состояниями данного алгоритма. В ячейках, которые образуются пересечениями данного ряда и колонки записываются команды переходов. В МТ всегда есть стартовое состояние и конечное состояние. То есть она состоит из минимум двух состояний.
Подробно с работой МТ можно ознакомится в сети, например: https://ru.wikipedia.org/wiki/... 0%B3%D0%B0
Или даже поиграться на онлайн симуляторах, коих много в сети.

Первый пример.

Откроем первую главу КР, если кто забыл, то так мы согласились именовать книгу Кернигана и Ритчи "Язык программирования Си".
Давайте разберём небольшой пример, который к тому же позволит нам изучить некоторые особенности языка Си.
Данный пример из главы 1.6 представляет из себя подсчёт слов, строк и символов:

#include <stdio.h> 
 
#define IN 1 /* внутри слова */ 
#define OUT 0 /* вне слова */ 
 
/* подсчет строк, слов и символов */ 
main () 
{ 
     int с, nl, nw, nc, state; 
     state = OUT; 
     nl = nw = nc = 0; 
     while ((c = getchar()) != EOF)
     { 
          ++nc; 
          if (c == '\n' ) 
               ++nl;
          if (c == " " || c == '\n' || с == '\t') 
               state = OUT; 
          else if (state == OUT)
          { 
                state = IN; 
                ++nw; 
          } 
     printf ("%d %d %d\n", nl, nw, nc); 
}

Что касается подсчёта строк, то тут всё просто: считаем количество \n. Количество символов также: считаем каждый введённый символ.
Примечателен алгоритм подсчёта слов. Его и разберём.
Прежде всего удалим из данного кода подсчёт строк и символов, чтобы сильнее сосредоточиться на основном алгоритме подсчёта слов, сохранив при этом сам алгоритм подсчёта слов. Также избавимся от getchar() с тем, чтобы было возможно работать с готовой примерной строкой, а в дальнейшем выполнить и некоторые бенчмарки. Преобразовав, получим данный код:

#include <stdio.h> 
#define N 255
 
#define IN 1 /* внутри слова */ 
#define OUT 0 /* вне слова */ 
 
char s[N]="Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed";
 
int main(void) 
{ 
     int nw, state; 
     char *p=s;
     state = OUT; 
     nw = 0; 
     while (*p)
     {
          if(*p == ' ' || *p == '\n' || *p == '\t') 
               state = OUT; 
          else if (state == OUT)
          { 
                state = IN; 
                ++nw; 
          }
          ++p;
     } 
     printf ("%d\n", nw);
    return 0; 
}

Здесь мы в точности воспроизвели исходный алгоритм. Что тут примечательного? Во-первых, здесь мы наблюдаем чистый структурный код. Переменная-флаг - state призвана отмечать находимся ли мы в слове или вне слова. Слова разделяются (в данном коде) символами пробела, конца строк, и табуляции. Здесь мы встречаем новый для нас оператор инкремента ++, который просто увеличивает свой аргумент на единицу. В языке Си есть и противоположенный ему оператор декремента --, который уменьшает аргумент на единицу. На единицу можно увеличивать и так:

a = a+1;

или сокращённо так:

a +=1;

однако раньше компиляторы оптимизировали операции декремента и инкремента. К тому же отличие ещё в том, что если инкриментировать ПОСЛЕ аргумента:

a++;

то операция инкремента произойдёт ПОСЛЕ того, как выполнятся другие операторы выражения, в котором используется данный оператор. Это надо помнить. Вообще же из-за этой особенности данный оператор рекомендуется использовать с особой осторожностью или совсем отказаться от его употребления.
Препроцессорная директива #define позволяет определить макросы, то есть сокращённую запись некоторого выражения или константы, что позволяет сделать программу более поддерживаемой из-за того, что мы заменяем макросами так называемые "магические числа" в программе. В данном случае макросами мы заменили две числовые константы 1 и 0, дав им осмысленные имена. Теперь если нам потребуется изменить их значения мы можем это сделать в одном единственном месте не перелопачивая код всей программы. Препроцессор всю работу сделает за нас!
Сила, брат, не только в адресной арифметике, но и в макросах!

Указатель p, который мы настроили на первый элемент строки s, будет перемещаться по массиву строки и возвращать нам (разыменованием при помощи звёздочки - *) разыменованное значение элемента строки. Как видим , использование указателя сильно упростило как сам код, так и его понимание, так как отсутствует индексация. Привыкаем к указателям!.
Обратите внимание, если мы инкрементируем указатель так:

++p;

то будет увеличен адрес, который хранит указатель (указатель будет указывать на следующую по номеру ячейку памяти). А если вот так:

++*p;

то будет увеличено значение по адресу, который хранит указатель.
Также здесь мы видим логический оператор - ||. Он выполняет операцию ИЛИ над операндами, которые стоят по левую и правую стороны от него. А также оператор ==, который выполняет логическую операцию сравнения двух операндов слева и справа от него. Так как приоритет сравнения выше, чем операции ИЛИ, сначала будет выполнено сравнение, результат будет подставлен заместо данной операции, а затем уже будет выполнена операция ИЛИ.То есть строка:

1	if(p == ' ' \|\| p == '\n' \|\| *p == '\t')

означает следующее: если *p равно пробелу, или *p равно переводу строки, или *p равно табулятору.
Обратите внимание, что если к примеру первое выражение ИЛИ вернёт ДА (1), то остальные операции выполнятся не будут!
Имя переменной state в переводе означает "состояние", однако в данном коде нет явно выделенных состояний! Данная переменная просто хранит логическое значение в слове ли мы находимся в данный момент или нет. Цикл один.
Вроде как решение оптимальное и выглядит достойно, но давайте подумаем: а правильный ли это алгоритм? Можно ли тут выделить какие-то состояния, как в машине тьюринга?

Что такое "состояние"?

Попробую показать на примере, что такое состояние и с чем его едят..
В каждой квартире есть выключатель освещения. Довольно простой прибор - в каждом доме их может быть много. Входим на кухню включаем свет, выходим - выключаем.
Выключатель - устройство, которое имеет два состояния:
1) Включен;
2) Выключен;
В каждом из этих двух состояний он может находиться продолжительное время, и переключаться из одного состояния в другое по событию. Событие вызывается человеком, который нажимает на кнопку переключателя. Таким образом, такая машина (автомат) имеет 2 состояния, а его входной алфавит состоит из одного события - нажатия на кнопку.

Состояния есть у каждого мало-мальски сложного обьекта. Например человек - может находится в разных состояниях - сна, приёма пищи, прогулки, чтения и т.д. В каждом из них он может находится некоторое время.
Мыслить в терминах состояний довольно естественней, чем в терминах объектов. Состояние сна это не объект, а состояние, поэтому не всё в мире можно представить в терминах объектов.

Преобразование примера подсчёта слов.

Давайте преобразуем пример из КР в машину Тьюринга или автомат, и посмотрим что из этого выйдет, и какие плюсы мы можем из этого извлечь.
Данный алгоритм можно преобразовать в два независимых состояния, в каждом из которых автомат может находиться некоторое время. Из природы решаемой задачи сразу видно, что тут имеется как минимум 2 состояния - "в слове" и "вне слова".

#include <stdio.h>
#define N 255
char s[N]="Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed";
int main(void)
{
 
    int nw = 0;
    
    char *p=s;
        --p;
    OUT:
        ++p;
        if(!*p)
            goto K;
        if(*p == ' ' || *p == ',' || *p == '\n')
            goto OUT;
        nw++; 
            goto IN;
    IN:
        if(!*p)
            goto K;
        if(*p == ' ' || *p == ',' || *p == '\n')
            goto OUT;
        ++p; 
            goto IN;
    K:
    printf ("%d \n",  nw);
    return 0;
}

Данный алгоритм переходит из одного независимого "цикла" в другой, что абсолютно неприемлемо(даже невозможно) в структурной парадигме.
Проведённые бенчмарки показали, что хотя код последнего примера длиннее, однако выполняется он на 30-40% быстрее приведённого в книге КР.
Домашнее задание: попытайтесь без потери эффективности выполнить тот же самый алгоритм в структурном стиле.
Не спешите. Внимательно изучите оба примера, и попытайтесь понять почему последний на треть эффективнее первого, и что первый делал всё это время..
Давайте немного поиграемся, и избавимся от назойливых "goto", в последнем примере:

#include <stdio.h>
#define N 255
#define IF(x, y) if((x))goto y
#define $(x) goto x
char s[N]="Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed";
int main(void)
{
 
    int nw = 0;
    
    char *p=s;
        --p;
    OUT:
        ++p;
        IF(!*p, K);
        IF(*p == ' ' || *p == ',' || *p == '\n', OUT);
             nw++; 
         $(IN);
    IN:
        IF(!*p, K);
        IF(*p == ' ' || *p == ',' || *p == '\n', OUT);
             ++p; 
         $(IN);
    K:
    printf ("%d\n",  nw);
    return 0;
}

Символ $ хорошо подходит для обозначения прямого безусловного перехода - вертикальная черта пересекает извилистый путь, то есть прямой путь всегда эффективнее кривого..
Продолжение следует...

Размещено в Без категории

Показов 8947 Комментарии 87

« Уроки программинга. Урок 5. Начало просветления. Главная страница Уроки программинга. Урок № 7. Ещё один пример разберём. »

Всего комментариев 87

Комментарии

1 из 5

По-моему здесь где-то ошибка/и

1	if (c == " " \|\| c == '\n' \|\| с '\t')

Запись от bedvit размещена 31.05.2019 в 18:20 bedvit вне форума

А теперь посмотрим на такой код:

#include <stdio.h>
#define N 255
char s[N] = "Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed";
int main(void)
{
    int nw;
    bool prev = true;
    bool curr = true;
    char *p = s;
 
    for (nw=0; *p; p++)
    {
        prev = curr;
        curr = (*p == ' ' || *p == ',' || *p == '\n');
        nw += prev && !curr;
    }
    printf ("%d\n", nw);
    return 0;
}

Запись от liv размещена 31.05.2019 в 18:21 liv вне форума

Цитата:

Сообщение от bedvit

По-моему здесь где-то ошибка/и

1	if (c == " " \|\| c == '\n' \|\| с '\t')

Копипастил из русского перевода КР, а там эта опечатка.

Запись от CoderHuligan размещена 31.05.2019 в 18:27 CoderHuligan вне форума

	По скорости - слишком короткая строка, не удалось определить победителя
	Запись от bedvit размещена 31.05.2019 в 18:28

	Цитата: Сообщение от bedvit По скорости - слишком короткая строка, не удалось определить победителя Надо вкладывать во внешний цикл. Позже проведу проверку.
	Запись от CoderHuligan размещена 31.05.2019 в 18:41

	CoderHuligan, ну и чем Ваш код лучше? То, что читается хуже, так это однозначно... А работает ничуть не быстрее...
	Запись от liv размещена 31.05.2019 в 18:41

Ещё и дублирование кода, вот это вот, два куска практически одинаковые

 if(!*p)
            goto K;
        if(*p == ' ' || *p == ',' || *p == '\n')
            goto OUT;
        nw++; 
            goto IN;

        if(!*p)
            goto K;
        if(*p == ' ' || *p == ',' || *p == '\n')
            goto OUT;
        ++p; 
            goto IN;

Запись от rerf2010rerf размещена 31.05.2019 в 18:54 rerf2010rerf вне форума

Цитата:

Сообщение от liv

CoderHuligan, ну и чем Ваш код лучше?

Помните я в первом уроке писал что утрём носик отцам основателям? Он лучше тем, что работает быстрее кода отцов-основателей. Он просто эффективнее, если вам вообще что-то говорит это слово.

Цитата:

Сообщение от liv

То, что читается хуже, так это однозначно...

Кому как..

Цитата:

Сообщение от liv

А работает ничуть не быстрее...

Проверим.

Запись от CoderHuligan размещена 31.05.2019 в 18:54 CoderHuligan вне форума

	Цитата: Сообщение от CoderHuligan Кому как.. Подавлющему большинству программистов
	Запись от liv размещена 31.05.2019 в 18:56

Кликните здесь для просмотра всего текста

#include <stdio.h>
#include <Windows.h>
#define N 1000
#define IF(x, y) if((x))goto y
#define $(x) goto x
char s[N] = "Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed ";
 
double get_time()
{
    LARGE_INTEGER t, f;
    QueryPerformanceCounter(&t);
    QueryPerformanceFrequency(&f);
    return (double)t.QuadPart / (double)f.QuadPart;
}
 
void bench(int func(char*), int count, const char* description)
{
    double start_time = get_time();
    double sum = 0;
 
    for (int i = 0; i < count; i++)
    {
        sum += func(s);
    }
 
    double time = get_time() - start_time;
 
    printf("%s: %f sum=%f\n", description, time, sum);
}
 
int calc_words_by_CoderHuligan(char* s)
{
    int nw = 0;
 
    char* p = s;
OUTWORD:
    ++p;
    IF(!*p, K);
    IF(*p == ' ' || *p == ',' || *p == '\n', OUTWORD);
    nw++;
    $(INWORD);
INWORD:
    IF(!*p, K);
    IF(*p == ' ' || *p == ',' || *p == '\n', OUTWORD);
    ++p;
    $(INWORD);
K:
 
    return nw;
}
 
int calc_words_by_TopLayer(char* s)
{
    int inWord = 0;
    int count = 0;
 
    for (char* curr = s; 1; ++curr)
    {
        switch (*curr)
        {
        case ' ':
        case ',':
        case '\n':
            inWord = 0;
            break;
        case '\0':
            return count;
        default:
            count += 1 - inWord;
            inWord = 1;
            break;
        }
    }
}
 
int calc_words_by_CR(char* s)
{
    int nw, state;
    char* p = s;
    state = 0;
    nw = 0;
    while (*p)
    {
        if (*p == ' ' || *p == '\n' || *p == '\t')
            state = 0;
        else if (state == 0)
        {
            state = 1;
            ++nw;
        }
        ++p;
    }
    return nw;
}
 
int main(void)
{
    int count = 50 * 1000 * 1000;
 
    for (int i = 0; i < 5; i++)
    {
        bench(calc_words_by_TopLayer, count, "TopLayer\t");
        bench(calc_words_by_CoderHuligan, count, "CoderHuligan\t");
        bench(calc_words_by_CR, count, "CR\t\t");
        printf("\n");
    }
}

Результаты x86

Кликните здесь для просмотра всего текста

Код:

TopLayer        : 12.917347 sum=1350000000.000000
CoderHuligan    : 14.812625 sum=1350000000.000000
CR              : 12.661899 sum=1350000000.000000

TopLayer        : 12.802429 sum=1350000000.000000
CoderHuligan    : 16.617118 sum=1350000000.000000
CR              : 12.346018 sum=1350000000.000000

TopLayer        : 12.718622 sum=1350000000.000000
CoderHuligan    : 14.780174 sum=1350000000.000000
CR              : 12.028693 sum=1350000000.000000

TopLayer        : 12.303113 sum=1350000000.000000
CoderHuligan    : 15.288510 sum=1350000000.000000
CR              : 12.544408 sum=1350000000.000000

TopLayer        : 12.637029 sum=1350000000.000000
CoderHuligan    : 14.957522 sum=1350000000.000000
CR              : 11.901372 sum=1350000000.000000

Результаты x64

Кликните здесь для просмотра всего текста

Код:

TopLayer        : 10.847556 sum=1350000000.000000
CoderHuligan    : 13.810305 sum=1350000000.000000
CR              : 14.043269 sum=1350000000.000000

TopLayer        : 10.784305 sum=1350000000.000000
CoderHuligan    : 13.125637 sum=1350000000.000000
CR              : 13.482344 sum=1350000000.000000

TopLayer        : 10.542314 sum=1350000000.000000
CoderHuligan    : 13.152043 sum=1350000000.000000
CR              : 14.088173 sum=1350000000.000000

TopLayer        : 10.998437 sum=1350000000.000000
CoderHuligan    : 13.457013 sum=1350000000.000000
CR              : 13.632453 sum=1350000000.000000

TopLayer        : 10.612615 sum=1350000000.000000
CoderHuligan    : 13.171614 sum=1350000000.000000
CR              : 13.673943 sum=1350000000.000000

Запись от TopLayer размещена 31.05.2019 в 19:15 TopLayer вне форума

Вот мой результат сравнения таким несложным образом:

Кликните здесь для просмотра всего текста

#include <time.h>
#include <stdio.h>
#define N 255
char s[N] = "Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed";
int main(void)
{
    clock_t time = clock();
 
    for (int i = 0; i < 10000000; i++)
    {
        int nw;
 
        bool prev = true;
        bool curr = true;
        char *p = s;
 
        nw = 0; 
        while(*p)
        {
            prev = curr;
            curr = (*p == ' ' || *p == ',' || *p == '\n');
            nw += prev && !curr;
            p++;
        }
    }
 
    printf("%f\n", (double)(clock() - time) / CLOCKS_PER_SEC);
    
#define IF(x, y) if((x))goto y
#define $(x) goto x
        time = clock();
        
        for (int i = 0; i < 10000000; i++)
        {
                int nw = 0;
 
                char *p = s;
            OUT:
                ++p;
                IF(!*p, K);
                IF(*p == ' ' || *p == ',' || *p == '\n', OUT);
                nw++;
                $(IN);
            IN:
                IF(!*p, K);
                IF(*p == ' ' || *p == ',' || *p == '\n', OUT);
                ++p;
                $(IN);
            K:;
        }
        printf("%f\n", (double)(clock() - time) / CLOCKS_PER_SEC);
        return 0;
}

Результат сильно зависит от того Debug версия или Release
Вот что выдала Release программа:

0.673000
3.010000

В 4.5 (!) раз мой фрагмент работает быстрее!

В Debug версии правда в 2 раза медленнее... Но Debug есть Debug...
Кому-то тут известно слово "эффективность"...

Запись от liv размещена 31.05.2019 в 19:28 liv вне форума

Обновил(-а) liv 31.05.2019 в 19:59

Цитата:

В 4.5 (!) раз моя подпрограммка работает быстрее!

На моем ноуте только в 3 раза при компиляции под x86, и в 2,5 раза при компиляции под x64.
А вот если перенести на C, то уступит всем вариантам. Может у меня бенч с ошибкой?

int calc_words_by_liv(char* s)
{
    int nw;
 
    int prev = 1;
    int curr = 1;
    char* p = s;
 
    nw = 0;
    while (*p)
    {
        prev = curr;
        curr = (*p == ' ' || *p == ',' || *p == '\n');
        nw += prev && !curr;
        p++;
    }
 
    return nw;
}

Запись от TopLayer размещена 31.05.2019 в 20:01 TopLayer вне форума

	Твой код имеет поведение, отличное от первого кода из КР. Дооптимизировался. https://rextester.com/RCS2118 https://rextester.com/CQEPC95958
	Запись от Croessmah размещена 31.05.2019 в 20:07

TopLayer, ничего не скажу... А по мне, так и 3, и 2.5 раза говорят, что все, что пытается нам донести уважаемый ТС, мягко скажем, не дает никаких преимуществ, а только значительно усложняет понимание... И ради чего?

Мое мнение только углубилось...

Запись от liv размещена 31.05.2019 в 20:11 liv вне форума

Неужели главной характеристикой кода является его быстродействие?
Для меня например нет разницы...
работает программа 0,001 секунды или 1 секунду. Всё-равно это ничего программисту не даст.
Время - деньги.
Более медленная программа как правило будет создана скорее. Вот где экономится время! Или я не прав? Тут собрались умные люди. И я полагаю, что они не фанатики, целью которых - "быстрая программа любой ценой"

Запись от wer1 размещена 01.06.2019 в 11:23 wer1 вне форума

Цитата:

работает программа 0,001 секунды или 1 секунду.

Разница в тысячу раз?

Цитата:

Или я не прав? Тут собрались умные люди. И я полагаю, что они не фанатики, целью которых - "быстрая программа любой ценой"

Вам разницы нет, а если эта программа, которая работает на сервере и обрабатывает миллионы запросов?
Или это часть алгоритма рендера в видеоредакторе?
Ждать окончания рендеринга час и десять часов - разница ощутимая.
НО! Прежде чем оптимизировать нормальный код, нужно доказать необходимость этой оптимизации.
Упарываться две недели, чтобы получить выполнение на две секунды быстрее в функции,
которая вызывается раз в десять минут - хреновый результат.

Цитата:

Время - деньги.

В данном случае можно попробовать просто "пустить" цикл оригинального кода в обратном порядке.
Скорее всего он будет работать быстрее, чем велосипед автора.

Запись от Croessmah размещена 01.06.2019 в 11:34 Croessmah вне форума

Это было сказано к тому что приоритеты (эффективность, ясность кода, скорость разработки итд.) сильно зависят от задачи.

И очевидно что хочется оптимизировать пиши на асме или делай асм вставки (с соответствующими последтвиями), а не страдай как автор фигней с goto.

Запись от Avazart размещена 01.06.2019 в 12:09 Avazart вне форума

Обновил(-а) Avazart 01.06.2019 в 12:12

Ну так, пока чай пил.

Обратный проход

void foo(void) 
{ 
    int nw = 0;
    int state = OUT; 
    char * p = s + strlen(s);
    while (p != s)
    {
        --p;
        if(IS_SPACE(*p)) {
            state = OUT; 
        }
        else if (state == OUT) { 
            state = IN; 
            ++nw; 
        }
    } 
    X = nw;
}

Запустил синтетические тесты.
Выполнялось 100000 прогонов на данных из файла в ~494 Кб.
Показало такой результат:

x64 - clang -O3 -DNDEBUG

Код:

Оригинальный код
Чтение файла...
Прочитано 494126 байт.
Результат: 71244
Время выполнения: 113.029847

Код от liv
Чтение файла...
Прочитано 494126 байт.
Результат: 70902
Время выполнения: 151.892191

Код от CoderHuligan
Чтение файла...
Прочитано 494126 байт.
Результат: 70902
Время выполнения: 97.843284

Код от Croessmah
Чтение файла...
Прочитано 494126 байт.
Результат: 71244
Время выполнения: 89.648194

x64 - gcc -O3 -DNDEBUG

Код:

Оригинальный код
Чтение файла...
Прочитано 494126 байт.
Результат: 71244
Время выполнения: 104.988702

Код от liv
Чтение файла...
Прочитано 494126 байт.
Результат: 70902
Время выполнения: 101.691142

Код от CoderHuligan
Чтение файла...
Прочитано 494126 байт.
Результат: 70902
Время выполнения: 114.833246

Код от Croessmah
Чтение файла...
Прочитано 494126 байт.
Результат: 71244
Время выполнения: 105.545979

x32 - clang -m32 -O3 -DNDEBUG

Код:

Оригинальный код
Чтение файла...
Прочитано 494126 байт.
Результат: 71244
Время выполнения: 148.357867

Код от liv
Чтение файла...
Прочитано 494126 байт.
Результат: 70902
Время выполнения: 137.317979

Код от CoderHuligan
Чтение файла...
Прочитано 494126 байт.
Результат: 70902
Время выполнения: 103.277272

Код от Croessmah
Чтение файла...
Прочитано 494126 байт.
Результат: 71244
Время выполнения: 104.967851

x32 - gcc -m32 -O3 -DNDEBUG

Код:

Оригинальный код
Чтение файла...
Прочитано 494126 байт.
Результат: 71244
Время выполнения: 100.925051

Код от liv
Чтение файла...
Прочитано 494126 байт.
Результат: 70902
Время выполнения: 89.601795

Код от CoderHuligan
Чтение файла...
Прочитано 494126 байт.
Результат: 70902
Время выполнения: 107.555324

Код от Croessmah
Чтение файла...
Прочитано 494126 байт.
Результат: 71244
Время выполнения: 108.041254

Как и ожидалось, все "оптимизации", в общем случае, бесполезны.

Ну и да, автор накосячил с алгоритмом, поэтому он выдает неправильный результат.
Код liv тоже этим грешит, видимо, переделывал не из оригинального кода.

Запись от Croessmah размещена 01.06.2019 в 12:17 Croessmah вне форума

Обновил(-а) Croessmah 01.06.2019 в 12:34

Да... Повеселили меня.. Оптимизацию не забыли случаем отключить? А? Почему-то об этом умолчали.. О том, что цикл for оптимизирован на уровне регистров тоже. В любом случае мои бенчмарки показывают несколько иной результат.
Тестировались два случая. Один через цикл, который выполняется 30000000 раз (тридцать милионов). Второй на длинной строке длиной 1 гигабайт при единичном цикле.
Оптимизация естественно отключена полностью, чтобы тестировать ИМЕННО алгоритм, а не оптимизатор вашего компилятора.
Первый случай показал такие результаты:
1) Код КР - 14 секунд.
2) Код Liv - 13 секунд.
3) Код на goto - 11 секунд.
Тестовые условия:

1	#define M 300000000

и раскомментируйте строку s. Закомментируйте выделение памяти и заполнение строки s.

Второй случай показал более удивительный результат на длинной строке длиной 1 гигабайт:
1) Код КР - 7 секунд.
2) Код Liv - 8 секунд.
3) Код на goto - 4 секунды.
Тестовые условия:

1 2	#define B 1000000000 #define M 1

Как я и писал на 30-50% быстрее мой вариант.

Вот код:

#include <stdio.h>
#include <stdlib.h> 
#include <time.h>
 
#define B 1000000000
#define M 1
#define N 255
//#define GOTO
#define KR
//#define LIV
#ifdef KR
    #define IN 1 
    #define OUT 0 
#endif
 
//char s[N]="Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed";
 
int main(void) 
{ 
    time_t st, en;
    //ДЛЯ длинной строки!
    // создаём и заполняем строку в куче( последовательность  - три пробела/6 букв а)
    char *s = (char*)malloc(sizeof(char)*B);
    char *f = s;
    long i;
    int c=0;
    for(i=0; i<B-1; ++i, ++c)
    {
        if(c<=6)
            f[i]='a';
        else
        {
            f[i]=' ';
            if(c>=9)c=0;
        }
    }
    f[B-1] = '\0';
 
    st=time(NULL);
    int state, nw = 0;
    char *p;
    int curr, prev;
#ifdef GOTO
    for(i=0; i<M; ++i)
    {
        nw = 0;
        p=s;
 
        OUT:
            ++p;
            if(!*p)
                goto K;
            if(*p == ' ' || *p == ',' || *p == '\n')
                goto OUT;
            nw++; 
                goto IN;
        IN:
            if(!*p)
                goto K;
            if(*p == ' ' || *p == ',' || *p == '\n')
                goto OUT;
            ++p; 
                goto IN;
        K:;
    }
#endif
#ifdef KR
    for(i=0; i<M; i++)
    {
        p=s;
        state = OUT; 
        nw = 0;
        while(*p)
        {
            if(*p == ' ' || *p == ',' || *p == '\n') 
                state = OUT; 
            else if (state == OUT)
            { 
                state = IN; 
                ++nw; 
            }
            ++p;
        }
    }
#endif
#ifdef LIV
    for(i=0; i<M; i++)
    {
        prev = 1;
        curr = 1;
        p = s;
        for (nw=0; *p; p++)
        {
            prev = curr;
            curr = (*p == ' ' || *p == ',' || *p == '\n');
            nw += prev && !curr;
        }
    }
#endif 
 
    en=time(NULL); 
    printf("Rezult: %ld sec.\n", en - st); 
    return 0;
}

Или я что-то не понимаю, или кто-то из нас пытается ввести в заблуждение.. У меня нехорошие мысли по этому поводу, друзья..

Я-то прекрасно осознаю, что мой алгоритм правильный, то есть оптимизирован на уровне самого алгоритма. Лучше уже не сделаешь. Поэтому вы не сможете приблизится к данной эффективности применяя структурный код. Просто признайте это.

Запись от CoderHuligan размещена 01.06.2019 в 14:29 CoderHuligan вне форума

Обновил(-а) CoderHuligan 01.06.2019 в 15:17

	Что бы оценивать эффективность алгоритма вообще тестировать не нужно. А вот как раз писать код и тестировать без учета оптимизации настоящее время как глупо.
	Запись от Avazart размещена 01.06.2019 в 16:55

1 из 5

Сообщение форума

Отменить изменения

Архив
< Апрель 2024
Вс	Пн	Вт	Ср	Чт	Пт	Сб
24	25	26	27	28	29	30
31	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	1	2	3	4