Форум программистов, компьютерный форум, киберфорум
C++
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 07.07.2019
Сообщений: 1

Проблема с синхронизацией многопоточной реализации алгоритма Карацубы для перемножения длинных полиномов

19.10.2021, 12:56. Показов 945. Ответов 0

Студворк — интернет-сервис помощи студентам
Добрый день, пишу лабораторную работу по параллельному программированию. Реализовал сам алгоритм перемножения полиномов, и теперь бьюсь над тем как его распараллелить. Идея заключалась в следующем:

Есть результирующий массив в котором будут записаны коэффициенты полиномов и на каждую ячейку массива я прикрепляю собственный мьютекс. Сам алгоритм делю на n потоков, которые в свою очередь при перемножении коэффициентов могут обратиться к одной ячейки массива. В моей голове было представление, что первый поток, который будет обращаться к этой ячейки будет захватывать мьютекс, а остальные будут ждать пока мьютекс не разлочится. На практике это оказалось не совсем так.

Немного распишу свой неопытный код:

В функции main я вызываю набор тестов, которые написал для проверки

C++
1
2
3
4
5
6
7
8
9
10
11
12
int main()
{
    setlocale(LC_ALL, "ru");
    string pathtest("c:/tests/test");
    string pathout("c:/tests/outs/out");
    for (int i = 0; i < 10; i++)
    {
        cout << "Тест №" << i << " в процессе выполнения..." << endl;
        tests(pathtest + to_string(i) + ".txt", pathout + to_string(i) + ".txt");
        cout << "_______________________________________________" << endl;
    }
}
Далее в процедуре tests я считываю коэффициенты двух полиномов и первоначально обрабатываю их в векторах. Вставлять весь код не буду, перейду сразу к вызову новых потоков. Для примера я создал 4 потока и передал "номер потока"(i), по которому буду определять область работы потока, количество коэффициентов, вектора с коэффициентами, вектора флагов со знаками коэффициентов, финальный вектор коэффициентов, финальный вектор флагов и вектор мьютексов.

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
void tests(string path, string pathout)
{
    //Обработка первоначальных данных
    ...
 
    thread Threads[4];
    vector<mutex> Mutexes(Final_Size);
 
    for (int i = 0; i < 4; i++)
    {
        Threads[i] = thread(thread_work, i, First_Coeffs_Size, Second_Coeffs_Size, First_Coeffs, Second_Coeffs,
            First_Signs, Second_Signs, ref(Final_Signs), ref(Final), ref(Mutexes));
    }
 
    for (int i = 0; i < 4; i++)
        Threads[i].join();
 
    //Вывод данных в файл
    ...
 
}
В процедуре thread_work рассчитываю диапазон значений, в котором будет работать поток. А после запускаю thread_lock, куда посылаю первый и второй коэффициенты полиномов, их флаги, вектор флагов финального массива (почему-то один флаг не дает передать), ячейку результирующего массива и мюьтекс.

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
void thread_work(int i, long long First_Coeffs_Size, long long Second_Coeffs_Size, vector<vector<long long>> First_Coeffs, vector<vector<long long>> Second_Coeffs,
    vector<bool> First_Signs, vector<bool> Second_Signs, vector<bool>& Final_Signs, vector<vector <long long>>& Final, vector<mutex>& Mutexes)
{
    //Расчет диапазона
    long long Interval = First_Coeffs_Size / 4;
    long long First = Interval * i;
    long long Second = Interval * i + Interval;
    if (i == 3)
        Second = First_Coeffs_Size;
 
    //Перебор коэффициентов первого полинома от First до Second
    for (int i = First; i < Second; i++)
    {
        //Перебор всех коэффициентов второго полинома
        for (int j = 0; j < Second_Coeffs_Size; j++)
            //Обработка данных
            thread_lock(i, j, First_Coeffs[i], Second_Coeffs[j], First_Signs, Second_Signs, Final_Signs, Final[i + j], Mutexes[i + j]);
    }
}
В процедуре thread_lock выполняется основной алгоритм для получения результата в элементах финального массива. Как видно сначала потоки используют свои данные, после происходит захват мюьтекса и идет изменение содержимого ячейки, а также возможное изменение флага (знака числа).

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
void thread_lock(int i, int j, vector<long long> First_Coeffs, vector<long long> Second_Coeffs,bool First_Signs,
bool Second_Signs, vector<bool>& Final_Signs,vector <long long>& Final, mutex& Mutexes)
{
    //Необщие данные
    auto n = max(First_Coeffs.size(), Second_Coeffs.size());
 
    extend_vec(First_Coeffs, n);
    extend_vec(Second_Coeffs, n);
 
    vector <long long> Broker = karatsuba_mul(First_Coeffs, Second_Coeffs);
    bool Broker_flag = true;
 
    if (First_Signs == Second_Signs)
        Broker_flag = true;
    else Broker_flag = false;
 
    finalize(Broker);
 
    while (Broker.size() > 1 && Broker.back() == 0)
        Broker.pop_back();
 
    Mutexes.lock();
 
    //Общие данные
    //addition(first,second) - сложение двух чисел и запись результата в первое число
    //subtraction(first,second) - вычитание двух чисел и запись результата в первое число
 
    if (Broker_flag == Final_Signs[i + j])
        addition(Final, Broker);
    else
    {
        //Определение знака финального числа
        switch (what_a_sign(Final, Broker))
        {
        case 1:
        {
            subtraction(Final, Broker);
            break;
        }
        case 2:
        {
            subtraction(Broker, Final);
            Final = Broker;
            Final_Signs[i + j] = Broker_flag;
            break;
        }
        case 3:
        {
            subtraction(Final, Broker);
            Final_Signs[i + j] = true;
            break;
        }
        }
    }
 
    while (Final.size() > 1 && Final.back() == 0)
        Final.pop_back();
 
    Mutexes.unlock();
}
В результате я получаю следующие данные
https://sun9-84.userapi.com/im... type=album

Слева на изображение результаты многопоточной обработки, а справа достоверные результаты выполненные в однопотоке. Как видно один элемент отличается. Данный баг может происходить в разных тестах, в разных коэффициентах - один, два раза. Я также пробовал использовать lock_guard и unique_lock и переписывать алгоритм в разных формах, но множество мьютексов дают такой результат. Бывает тесты выполняются корректно, из чего следует, что проблема в моих мьютексах. Причем, если взять и передавать всем один мьютекс в thread_lock (например Mutexes[0]), то естественно все потоки выполняются последовательно и результат является достоверным.

Еще одна интересная особенность, если я передаю в в процедуру thread_lock не единичные элементы, а все массивы, результат тоже становится достоверным, время работы подскакивает в разы на маленьких тестах, но на больших числах дает прирост.

Преподаватель говорил мне, что время ожидания потока может окончится и тогда поток просто закончится, если долго будет ожидать, потому что у мьютексов нет очереди, но я думаю не в этом дело. Также я слышал, что после разблокировки мьютекса, остальные потоки могут сразу зайти в секцию. В общем мои знания о синхронизации не структурированы и мне нужна помощь.

Мой вопрос заключается в следующем: можно ли при помощи мьютексов осуществить мою идею? Если нет, не могли бы вы подкинуть идею, как можно организовать данную синхронизацию при помощи примитивов синхронизации c++? Я ни разу не использовал семафоры и меня это сильно напрягает, потому что я не до конца понимаю как их можно использовать.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
19.10.2021, 12:56
Ответы с готовыми решениями:

Алгоритм карацубы для полиномов
Здравствуйте. Кто может набросать примеров : Алгоритм умножение полимонов карацубы.

Алгоритм Карацубы для умножения полиномов
Помогите, пожалуйста, реализовать алгоритм Карацубы для умножения двух полиномов. Информация по нему в основном для умножения чисел,...

БПФ для перемножения полиномов
Доброго времени суток! Как можно распараллелить преобразование Фурье для перемножения полиномов? P.S. Желательно использовать 2+...

0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
19.10.2021, 12:56
Помогаю со студенческими работами здесь

Метод Карацубы умножения длинных чисел
Реализован клас длинных чисел, с перегруженными операциями сложения, вычитания, умножения столбиком и реализован метод умножения Карацубы....

Умножьте два длинных числа, используя алгоритм Карацубы
Также надо написать алгоритм

Проблема в реализации алгоритма Джарвиса
Форум, привет. Написал в pygame реализацию алгоритма Джарвиса. Но проблема в том, что программа работает через раз (предполагаю, что дело в...

DLL для реализации функции перемножения двух чисел без знака
Нужна помощь с одним заданием. Мне не обязательно его выполнять, а хотя бы найти пример реализации. Нужно создать библиотеку для реализации...

Составить блок-схему для алгоритма перемножения одномерных массивов
Здравствуйте очень нужна помощь,готовлюсь к сесии,а как блок схему составить не могу понять в этой программе,а сессия уже в пятницу ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
1
Ответ Создать тему
Новые блоги и статьи
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка. Рецензия / Мнение/ Перевод https:/ / **********/ gallery/ thinkpad-x220-tablet-porn-gzoEAjs . . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru