Форум программистов, компьютерный форум CyberForum.ru

Параллельная сортировка, протестировать алгоритм - C++

Восстановить пароль Регистрация
Другие темы раздела
C++ Написать функцию, которая вычисляет объем шара http://www.cyberforum.ru/cpp-beginners/thread1043084.html
Написать функцию, которая вычисляет объем шара.
C++ Написать программу, которая выводит на экран точечный график функции Написать программу, которая выводит на экран точечный график функции y= √x. Диапазон изменения аргумента – от 0 до 5, шаг аргумента – 0.5. График вывести на фоне координатных осей ,точка пересечения которых должна находиться в центре экрана. http://www.cyberforum.ru/cpp-beginners/thread1043083.html
C++ Вывести только слова, которые лексикографически меньше введенного
Ввести строку и слово. Вывести только слова, которые лексикографически меньше введенного.
Подсчет количества символов и вывод дерева C++
Помогите пожалуйста написать написать программу.Вот само задание:Написать программу которая вводит с клавиатуры список вещественных чисел,подсчитывает количество положительных и отрицательных элементов списка,затем выводит с клавиатуры сбалансированное дерево и считате сумму элементов дерева.
C++ Обмен между значениями двух переменных, не используя при этом третьей переменной http://www.cyberforum.ru/cpp-beginners/thread1043067.html
Подскажите как написать программу, которая производит обмен между значениями двух переменных, не используя при этом третьей переменной
C++ Найти наибольший среди наименьших элементов строк и наименьший среди наибольших элементов строк 5.Найти наибольший среди наименьших элементов строк и наименьший среди наибольших элементов строк. подробнее

Показать сообщение отдельно
DiffEreD
 Аватар для DiffEreD
1420 / 757 / 95
Регистрация: 21.06.2011
Сообщений: 1,740
Записей в блоге: 2
18.12.2013, 02:06  [ТС]     Параллельная сортировка, протестировать алгоритм
Существенно упростил алгоритм, убрал лишнее. Получилось вроде неплохо:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
#include <iostream>
#include <iterator>
#include <vector>
#include <set>
#include <algorithm>
#include <numeric>
#include <thread>
#include <chrono>
#include <random>
 
namespace sp
{
static size_t const min_per_thread = 25; // минимальное кол-во элементов на поток
 
//получение границ по контейнеру
std::vector<size_t> get_bounds(size_t length, size_t threads)
{
   size_t block = length / threads;
   std::vector<size_t> bounds(threads + 1, block);
   bounds[0] = 0;
   std::partial_sum(bounds.begin() + 1, bounds.end(), bounds.begin() + 1);
   bounds.back() = length;
   return bounds;
}
 
template <typename Iterator, typename Compare = std::less<typename std::iterator_traits<Iterator>::value_type> >
void sort_when_two_threads(Iterator first, Iterator last, Compare comp = std::less<typename std::iterator_traits<Iterator>::value_type>())
{
   size_t const length = std::distance(first, last);
   std::vector<size_t> bounds = get_bounds(length, 2);
 
   std::thread t(std::sort<Iterator, Compare>, first + bounds[0], first + bounds[1], comp);
   std::sort(first + bounds[1], first + bounds[2], comp);
   t.join();
 
   std::inplace_merge(first + bounds[0], first + bounds[1], first + bounds[2], comp);
}
 
template <typename Iterator, typename Compare = std::less<typename std::iterator_traits<Iterator>::value_type> >
void sort_parallel(Iterator first, Iterator last, Compare comp = std::less<typename std::iterator_traits<Iterator>::value_type>())
{
   size_t const length = std::distance(first, last);
   if (!length)
      return;
 
   size_t const hardware_threads = std::thread::hardware_concurrency();
   if (hardware_threads <= 1 || length <= min_per_thread)
   {
      std::sort(first, last, comp);
      return;
   }
 
   if (hardware_threads == 2)
   {
      sort_when_two_threads(first, last, comp);
      return;
   }
 
   //ограничение максимального количества потоков
   size_t const max_threads = (length + min_per_thread - 1) / min_per_thread;
 
   //финальный выбор кол-ва требуемых потоков
   size_t num_threads = std::min(hardware_threads, max_threads); //NOTE
 
   //размечаем границы по которым будем работать
   std::vector<size_t> bounds = get_bounds(length, num_threads);
 
   //sort step:
   std::vector<std::thread> threads(num_threads - 1);
   for (size_t i = 0; i < threads.size(); ++i)
   {
      threads[i] = std::thread(std::sort<Iterator, Compare>, first + bounds[i], first + bounds[i + 1], comp);
   }
   std::sort(first + bounds[bounds.size() - 2], first + bounds.back(), comp);
   for (auto& t : threads) t.join();
   threads.clear();
 
   //merge step:
   std::set<size_t> new_bounds;
   while (num_threads >= 2)
   {
      num_threads /= 2;
      for (size_t i = 0, j = 0; i < num_threads; j += 2, ++i)
      {
         threads.emplace_back(std::inplace_merge<Iterator, Compare>, first + bounds[j],
                              first + bounds[j+1], first + bounds[j+2], comp);
 
         new_bounds.insert(bounds[j]);
         new_bounds.insert(bounds[j+2]);
      }
 
      if (new_bounds.find(bounds.back()) == new_bounds.end())
      {
         size_t size = bounds.size();
         threads.back().join();
 
         std::inplace_merge(first + bounds[size-4], first + bounds[size-2], first + bounds[size-1], comp);
         new_bounds.erase(bounds[size-2]);
         new_bounds.insert(bounds[size-4]);
         new_bounds.insert(bounds[size-1]);
 
         threads.pop_back();
      }
 
      bounds.assign(new_bounds.begin(), new_bounds.end());
      new_bounds.clear();
 
      for (auto& t : threads) t.join();
      threads.clear();
   }
   std::inplace_merge(first, first + bounds[2], first + length, comp);
}
} // namespace sp
 
///////////////////////////////////////////////////////////////////////////
 
// имитация загрузки ядер процессора
long long fib(long long i) { return i < 3 ? 1 : fib(i - 1) + fib(i - 2); }
 
class long_less_op
{
    int n;
public:
    long_less_op(int n_ = 0) : n(n_) {}
    bool operator < (const long_less_op& other) const
    {
        fib(5);
        return n < other.n;
    }
};
 
// таймер времени
namespace ch = std::chrono;
 
template <typename duration = ch::seconds, typename clock = ch::high_resolution_clock>
class timer
{
   typename clock::time_point m_start;
   typename clock::time_point m_stop;
public:
   timer() : m_start(clock::now()), m_stop(clock::now()) {}
 
   void start(){ m_start = clock::now(); }
 
   typename clock::rep get_time()
   {
      m_stop = clock::now();
      return ch::duration_cast<duration>(m_stop - m_start).count();
   }
};
 
int main()
{
    std::default_random_engine gen(ch::system_clock::now().time_since_epoch().count());
 
    std::vector<long_less_op> v(25432415);
    std::iota(v.begin(), v.end(), -1000000);
    std::shuffle(v.begin(), v.end(), gen);
 
 
    auto copy_for_test = v;
    std::cout << std::boolalpha;
    std::cout << "Parallel sorting:\n";
    std::cout << "Is sorted -> " << std::is_sorted(copy_for_test.begin(), copy_for_test.end());
 
    timer<ch::milliseconds> t;
    sp::sort_parallel(copy_for_test.begin(), copy_for_test.end());
    std::cout << "\nTIME: " << t.get_time() << " milliseconds." << std::endl;
    std::cout << "Is sorted -> " << std::is_sorted(copy_for_test.begin(), copy_for_test.end());
 
    copy_for_test = v;
    std::cout << "\n\nDefault sorting:\n";
    t.start();
    std::sort(copy_for_test.begin(), copy_for_test.end());
    std::cout << "TIME: " << t.get_time() << " milliseconds." << std::endl;
 
    std::cout << "\n\nDone." << std::endl;
    return 0;
}
Если у кого есть желание и более 2-х ядер, то поделитесь своими результатами. Вот мои:
g++ 4.8.2 || 2-х ядерный проц

Parallel sorting:
Is sorted -> false
TIME: 21073 milliseconds.
Is sorted -> true

Default sorting:
TIME: 36635 milliseconds.
 
Текущее время: 19:02. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2016, vBulletin Solutions, Inc.
Рейтинг@Mail.ru