Форум программистов, компьютерный форум, киберфорум
Наши страницы

Оптимизация умножения матриц 4x4 - C++

Войти
Регистрация
Восстановить пароль
Другие темы раздела
C++ Найти наибольшее и наименьшее значение среди элементов массива http://www.cyberforum.ru/cpp-beginners/thread1113958.html
Найти наибольшее и наименьшее значение среди элементов массива Вот начало, надо переделать что бы писало наибольшее и наименьшее значение: #include <iostream> #include <ctime> using namespace...
C++ Составить список студентов, имеющих задолженности хотя бы по одному предмету Решить с комментариями. В списке студентов указано: - ФИО; - № группы; - оценки за сессию. 1) Составить список студентов, имеющих задолженности хотя бы по одному предмету. 2) Определить... http://www.cyberforum.ru/cpp-beginners/thread1113949.html
Создать новый файл D из чисел, которые встречаются во всех трех файлах C++
Решить на С++, с комментариями. Спасибо:) Даны три файла: А,В,С из целых чисел. Создать новый файл D из чисел, которые встречаются во всех трех файлах.
Подсчет времени работы программы C++
пожалуйста помогите посчитать время программы с функцией.не знаю почему программа выдает что-то странное,вместо сложения,а время пишет 0. #include<iostream> #include<windows.h> using namespace...
C++ Матрицы (разъясните код) http://www.cyberforum.ru/cpp-beginners/thread1113938.html
пожалуйста разъясните код: void swap(double &a, double &b) { double temp = a; a = b; b = temp; } void M(double **A, double *B, unsigned dim) { for (unsigned k = 0; k < dim; ++k)
C++ Реализовать класс стек, хранящий в себе строки Необходимо реализовать класс стек, хранящий в себе строки. Чужие реализации не интересуют. Шаблоны использовать нельзя. Вот, что написал. Не знаю как реализовать функцию Push. С обычным целочисленным... подробнее

Показать сообщение отдельно
VTsaregorodtsev
371 / 354 / 52
Регистрация: 19.02.2010
Сообщений: 1,509
09.03.2014, 21:38
Heisenberg, по размеру матрицы - всё заточено под векторизацию (SSE-команды).
В мат.библиотеках (BLAS или интеловская MKL) однозначно должны быть специально написанные быстрые функции под такой размер матриц.
Но векторизация требует предварительного транспонирования второй матрицы. И тут надо смотреть весь остальной код - лучше сделать так, чтобы эта вторая матрица была постоянной или очень редко изменяемой (чтобы транспонировать не при каждом умножении - а только один раз или малое число раз).
1
 
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru