Количество потоков, насколько я понимаю (могу и ошибаться) никак не виляет на производительность, если они запущены на одном и том же ядре процессора. Соответственно для подобных задач нужно создать по потоку на ядро. Но опять же повторюсь могу ошибаться, сам серьезно в это не вникал.
0
|