Оптимизация кода Python с Cython и Numba

Запись от py-thonny размещена 23.04.2025 в 19:05

Метки cpu, cython, hardware, numba, python

Нажмите на изображение для увеличения
Название: 9dc9fd32-53f0-4fb6-b838-b254c962cfc8.jpg
Просмотров: 301
Размер: 220.8 Кб
ID: 10635

Python прочно обосновался в топе языков программирования благодаря своей простоте и гибкости. Разработчики любят его за читабельность кода и богатую экосистему библиотек. Но у этой медали есть и обратная сторона — производительность. Когда дело доходит до вычислительно-интенсивных задач, Python нередко проигрывает языкам с компиляцией в машинный код, как C++ или Rust. Проблема кроется в природе интерпретируемого языка. Pyton выполняется построчно, код динамически типизирован, а печально известный GIL (Global Interpreter Lock) ограничивает возможности параллельного выполнения в многопоточных приложениях. Эти особенности языка превращаются в узкие места при работе с большими объемами данных или сложными вычислениями.

Но что если нужно сохранить удобство Python и при этом добиться скорости, сравнимой с компилируемыми языками? Тут и появляются инструменты оптимизации: Cython и Numba.

Cython — это надмножество Python позволяющее писать код, который компилируется в нативный C++. Разработчик может добавлять статическую типизацию и вызывать C-функции напрямую. Проект стартовал в 2007 году как эволюция Pyrex и за годы развития превратился в мощный инструмент для ускорения критичных к производительности участков кода.

Numba, появившаяся позже в 2012 году, пошла другим путём. Это JIT-компилятор, использующий библиотеку LLVM для преобразования Python-функций в оптимизированный машинный код "на лету". Простота использования Numba подкупает: достаточно добавить декоратор к функции, и магия компиляции произойдёт автоматически.

Интересно, что разработка инструментов оптимизации для Python имеет долгую историю. Ещё до появления Cython и Numba существовали проекты вроде Psyco — ранний JIT-компилятор для Python, заложивший концептуальную основу для будущих решений. Однако его развитие прекратилось в 2011 году, и на смену пришли новые, более совершенные инструменты. Помимо рассматриваемых нами Cython и Numba, существуют и альтернативные подходы к оптимизации Python-кода. Один из самых известных — PyPy, альтернативная реализация интерпретатора Python с встроенным JIT-компилятором. PyPy способен значительно ускорить код без его модификации, но имеет ограничения по совместимости с некоторыми библиотеками.

В чем же конкретно заключаются узкие места производительности Python? Во-первых, это циклы. Каждая итерация цикла в Python — это серия интерпретируемых операций, что существенно медленнее компилированного кода. Во-вторых, математические вычисления, особенно с большими массивами данных. В-третьих, работа с объектами и их атрибутами, которая в Python сопряжена с дополнительными накладными расходами из-за динамической природы языка.

Но стоит ли вообще заморачиваться с оптимизацией? Дональд Кнут когда-то заметил: "Преждевременная оптимизация — корень всех зол". И в этом есть доля истины. Оптимизировать код имеет смысл только в тех случаях, когда:

1. Профилирование выявило реальные узкие места в производительности.
2. Эти узкие места находятся в критичном для пользователя участке кода.
3. Простые улучшения алгоритма уже не помогают.

Например, если 90% времени выполнения программы занимает один цикл, обрабатывающий миллионы элементов, имеет смысл оптимизировать именно его. Но если программа большую часть времени ждёт ввода пользователя или ответа от сети, оптимизация вычислений даст минимальный эффект.

Что касается совместимости, то и Cython, и Numba поддерживают современные версии Python. Cython работает с Python 2.6+ и 3.3+, хотя наиболее эффективен с Python 3.7+. Numba официально поддерживает Python 3.7-3.10 и постепенно добавляет поддержку более новых версий. Обе технологии активно развиваются и адаптируются к эволюции самого языка Python. Выбор между Cython и Numba зависит от многих факторов: специфики задачи, опыта разработчика, требований к интеграции с существующим кодом. Cython даёт более точный контроль и лучшие результаты при правильной настройке, но требует больше изменений в исходном коде. Numba проще в использовании, но имеет ограничения по поддерживаемым языковым конструкциям.

Основы работы с Cython

Cython можно представить как мост между двумя мирами — гибким, но медленным Python и быстрым, но строгим C. В его основе лежит простой принцип: взять Python-код, добавить статическую типизацию и скомпилировать в эффективный машинный код через C. Когда мы пишем обычный Python-код, интерпретатор на каждом шаге вынужден определять типы объектов, проверять их совместимость и только потом выполнять операции. В Cython же компилятор точно знает, с чем имеет дело, и генерирует оптимальный машинный код, минуя эти проверки. Процесс компиляции Cython-кода проходт в несколько этапов. Сначала .pyx файл транслируется в промежуточный C-код, который затем компилируется стандартным C-компилятором в динамическую библиотеку (.so на Linux/Mac или .pyd на Windows). Получившийся модуль можно импортировать в Python как обычный пакет.

Python
1
2
3
# Пример простейшего .pyx файла (example.pyx)
def say_hello(name):
    print(f"Hello, {name}!")

Красота Cython в том, что даже такой простой код уже немного быстрее обычного Python, хотя настоящая мощь раскрывается при добавлении статической типизации.

Статические типы — это сердце оптимизации в Cython. Когда компилятор знает тип переменной он может заменить динамические проверки и операции Python на прямые вызовы C-функций. Разница в скорости может быть колоссальной:

Python
1
2
3
4
5
6
# Python-версия
def calculate_sum(n):
    total = 0
    for i in range(n):
        total += i
    return total

C
1
2
3
4
5
6
7
8
9
10
11
12
13
# Cython-версия (sum.pyx)
def calculate_sum_cy(n):
    total = 0
    for i in range(n):
        total += i
    return total
 
cpdef int calculate_sum_typed(int n):
    cdef int total = 0
    cdef int i
    for i in range(n):
        total += i
    return total

Заметьте три ключевых модификатора: cdef для объявления C-переменных, cpdef для создания гибридных функций (доступных и из Python, и из C) и указание типов (int, float, double и т.д.). Для компиляции Cython-кода нужно сначала установить сам пакет:

Bash
1
pip install cython

Затем создать файл setup.py:

Python
1
2
3
4
5
6
from setuptools import setup
from Cython.Build import cythonize
 
setup(
    ext_modules = cythonize("sum.pyx")
)

И запустить компиляцию:

Bash
1
python setup.py build_ext --inplace

После компиляции модуль можно импортировать и использовать как обычно:

Python
1
2
3
import sum
result = sum.calculate_sum_typed(1000000)
print(result)

Особенно впечатляющие результаты Cython демонстрирует при оптимизации циклов. В чистом Python каждая итерация цикла требует множества служебных операций. В Cython эти операции заменяются эффективным C-кодом.
Иногда даже лучше использовать C-стиль циклов вместо стандартного Python range():

Python
1
2
3
4
5
6
7
cpdef int calculate_sum_c_loop(int n):
    cdef int total = 0
    cdef int i = 0
    while i < n:  # C-style loop
        total += i
        i += 1
    return total

Для еще большей производительности Cython предлагает ряд специальных декораторов. Например, @cython.boundscheck(False) и @cython.wraparound(False) отключают проверки границ массивов и обработку отрицательных индексов, что существенно ускоряет код за счет снижения безопасности.
Впрочем, статическая типизация — это только начало. Cython позволяет работать с указателями, структурами и функциями из C. Это открывает путь к интеграции с существующими C-библиотеками.
Типичный кейс — обертка над низкоуровневым API. Допустим, у нас есть C-библиотека с функцией:

C
1
2
// mathlib.h
double fast_exp(double x);

В Cython можно создать файл описания .pxd (аналог заголовочного файла):

C
1
2
3
# mathlib.pxd
cdef extern from "mathlib.h":
    double fast_exp(double x)

И затем использовать эту функцию в .pyx файле:

C
1
2
3
4
5
# math_wrapper.pyx
cimport mathlib
 
def exp(x):
    return mathlib.fast_exp(x)

Особенно полезен Cython при работе с NumPy. Он позволяет напрямую обращаться к содержимому массивов без Python-накладных расходов:

C
1
2
3
4
5
6
7
8
9
10
11
12
import numpy as np
cimport numpy as cnp
 
def fast_multiply(cnp.ndarray[double, ndim=1] a, cnp.ndarray[double, ndim=1] b):
    cdef int i
    cdef int n = a.shape[0]
    cdef cnp.ndarray[double, ndim=1] result = np.zeros(n, dtype=np.float64)
    
    for i in range(n):
        result[i] = a[i] * b[i]
        
    return result

При тестировании такая функция может быть в 10-100 раз быстрее наивной реализации на чистом Python, хотя для справедливости стоит заметить, что векторизованная операция a * b в NumPy будет не менее эффективной.
Отладка Cython-кода может быть непростой задачей. Компилированный код уже не так просто трассировать, как Python-скрипт. К счастью, есть инструменты, облегчающие жизнь. Один из них — генерация аннотированного HTML-отчета:

Bash
1
cython -a mymodule.pyx

Команда создаст файл mymodule.html, в котором строки кода будут подсвечены разными цветами в зависимости от их эффективности. Белые участки — чистый C-код, желтые — взаимодействие с Python (потенциальные узкие места). Для отладки в реальном времени можно включить отладочные символы при компиляции:

Bash
1
python setup.py build_ext --inplace --debug

Это позволит использовать стандартные отладчики вроде gdb или lldb для анализа программы на уровне машинного кода.
А для простых случаев всегда остается верный друг программиста — отладочный вывод с помощью print. В отличие от сложного C/C++ кода, в Cython легко добавить вывод промежуточных значений для отслеживания хода выполнения.

Пока мы только коснулись возможностей отладки Cython-кода, но поговорим об этом детальнее. Помимо упомянутого аннотированного HTML-отчета полезно использовать профилировщики для выявления узких мест. Стандартный cProfile работает с Cython-функциями, но видит их как "черные ящики". Для более глубокого анализа Cython предлагает свой профилировщик:

Python
1
2
3
4
5
6
7
8
9
10
11
# profiling.pyx
cimport cython
 
@cython.profile(True)  # Включаем профилирование для этой функции
def intensive_calculation(int n):
    cdef int i, j
    cdef double result = 0
    for i in range(n):
        for j in range(n):
            result += i / (j + 1)
    return result

Указав эту опцию, мы получим детальную статистику по скомпилированному коду. Сочетание профилирования с аннотированным отчетом дает мощный инструмент для точечной оптимизации. Настройка окружения для работы с Cython может быть расширена для больших проектов. Вместо простых setup.py-скриптов для компиляции одиночных файлов, можно создать полноценную структуру проекта:

Python
1
2
3
4
5
6
7
8
myproject/
├── myproject/
│   ├── __init__.py
│   ├── core.pyx
│   ├── utils.pyx
│   └── _dependencies.pxd
├── setup.py
└── tests/

В таком случае setup.py будет выглядеть сложнее:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
from setuptools import setup, find_packages, Extension
from Cython.Build import cythonize
import numpy
 
# Определяем расширения
extensions = [
    Extension(
        "myproject.core",
        ["myproject/core.pyx"],
        include_dirs=[numpy.get_include()],  # Для работы с NumPy
        extra_compile_args=["-O3"],  # Включаем оптимизации компилятора
        language="c++"  # Используем C++ вместо C
    ),
    Extension("myproject.utils", ["myproject/utils.pyx"])
]
 
setup(
    name="myproject",
    version="0.1.0",
    packages=find_packages(),
    ext_modules=cythonize(
        extensions,
        compiler_directives={
            "language_level": 3,
            "boundscheck": False,
            "wraparound": False,
            "initializedcheck": False
        }
    )
)

Это уже позволяет тонко настраивать параметры компиляции, включать заголовочные файлы и использовать оптимизации компилятора.

Теперь углубимся в оптимизацию циклов. Циклы часто становятся узким местом в Python-коде, и Cython может их радикально ускорить. Вот несколько приемов, которые стоит знать:

1. Накладные расходы на range(). Даже типизированный цикл for i in range(n) несет некоторые накладные расходы. Для максимальной производительности иногда лучше использовать C-стиль с while:

C
1
2
3
4
cdef int i = 0
while i < n:
    # операции
    i += 1

2. Разворачивание циклов. Если количество итераций небольшое и известно заранее, можно "развернуть" цикл:

C
1
2
3
4
5
6
7
8
9
# Вместо:
for i in range(4):
    result += data[i]
 
# Можно написать:
result += data[0]
result += data[1]
result += data[2]
result += data[3]

3. Векторизация с помощью memoryviews. При работе с массивами эффективнее использовать memoryviews — они дают прямой доступ к памяти NumPy-массивов:

C
1
2
3
4
5
6
7
8
9
import numpy as np
cimport numpy as cnp
 
def vector_dot(double[:] a, double[:] b):
    cdef int i
    cdef double result = 0.0
    for i in range(a.shape[0]):
        result += a[i] * b[i]
    return result

Это синтаксически проще, чем предыдущий пример с NumPy, и работает так же быстро.

4. Параллельное выполнение с OpenMP. Cython поддерживает OpenMP для распараллеливания циклов:

C
1
2
3
4
5
6
7
8
9
10
11
# Требуется компиляция с флагом -fopenmp
from cython.parallel import prange
 
cpdef double parallel_sum(double[:] array):
    cdef double total = 0
    cdef Py_ssize_t i
    
    for i in prange(array.shape[0], nogil=True):
        total += array[i]
        
    return total

Флаг nogil=True означает, что цикл выполняется без захвата GIL, что позволяет реализовать настоящий параллелизм. Это настоящая магия для тяжелых вычислений.
А что насчет взаимодействия с C-библиотеками? Это одна из сильнейших сторон Cython. Рассмотрим более сложный пример — использование библиотеки BLAS для умножения матриц:

C
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
# blas_wrapper.pyx
cdef extern from "cblas.h":
    void cblas_dgemm(
        int Order, int TransA, int TransB,
        int M, int N, int K,
        double alpha, double *A, int lda,
        double *B, int ldb, double beta,
        double *C, int ldc
    )
 
import numpy as np
cimport numpy as cnp
 
def fast_matrix_multiply(
    cnp.ndarray[double, ndim=2] A,
    cnp.ndarray[double, ndim=2] B
):
    cdef int m = A.shape[0]
    cdef int n = B.shape[1]
    cdef int k = A.shape[1]
    
    cdef cnp.ndarray[double, ndim=2] C = np.zeros((m, n), dtype=np.float64)
    
    # Убедимся, что массивы хранятся в С-порядке и непрерывны
    A = np.ascontiguousarray(A)
    B = np.ascontiguousarray(B)
    
    # Вызываем оптимизированную BLAS-функцию
    cblas_dgemm(
        101,   # CblasRowMajor
        111,   # CblasNoTrans
        111,   # CblasNoTrans
        m, n, k,
        1.0, <double*>A.data, A.strides[0] // sizeof(double),
        <double*>B.data, B.strides[0] // sizeof(double),
        0.0, <double*>C.data, C.strides[0] // sizeof(double)
    )
    
    return C

Этот пример демонстрирует, как вызвать высокооптимизированную BLAS-функцию для умножения матриц. Для больших матриц это может быть в сотни раз быстрее, чем наивная реализация на Python. Для более сложных библиотек можно использовать автоматические генераторы биндингов, например, CFFI или pybind11, но Cython остается самым гибким вариантом.

Типичной ошибкой новичков в Cython является недостаточная типизация. Помните: Cython оптимизирует только то, что точно знает. Если функция принимает Python-объекты, она будет медленнее, чем если бы принимала типизированные аргументы. Другая распространенная ошибка — злоупотребление динамической памятью. В C память нужно выделять и освобождать вручную, но Cython может делать это за вас. Например, при работе с массивами лучше использовать NumPy или memoryviews, а не выделять память вручную. Наконец, всегда имеет смысл профилировать код до и после оптимизации. Иногда изящный алгоритм на чистом Python будет быстрее, чем сложный и запутанный код на Cython.

Правильное использование Cython — это баланс между читаемостью, поддерживаемостью и производительностью. Не каждый кусок кода нуждается в оптимизации, но когда это необходимо, Cython предоставляет мощный и гибкий инструментарий для достижения лучших результатов. Стоит отметить интересную особенность: иногда достаточно оптимизировать всего 5-10% кода, чтобы получить 90% прироста производительности. Это напрямую связано с законом Парето — 20% усилий дают 80% результата. Поэтому вместо того чтобы переписывать весь проект на Cython, имеет смысл идентифицировать наиболее критичные места и заняться именно ими.

Ошибка в компиляции файла Cython
Привет! Создаём .pyx-файл с любым кодом, вбиваем в cmd cython fib.pyx -o fib.c на выходе .с-файл...

С numba что-то не так
def fact(x): f=1 while x != 0 and x != 1: f*=x*(x-1) x-=2 return f...

Как ускорить код? Numba?
Подскажите как можно ускорить код? TXT файлы весят 20MB, python долго считывает их. Пытался...

numba jit внутри класса, либо с обращением к атрибутам экземпляра
Здравствуйте! Прошу прощения, если пишу не в том разделе. Есть написанная программа, в...

Практическое применение Numba

Если Cython требует изменения синтаксиса и явной компиляции, то Numba предлагает совершенно иной подход: компиляция налету (JIT) через простое добавление декораторов. Это делает Numba крайне привлекательным инструментом для тех, кто хочет ускорить Python-код с минимальными изменениями. В основе Numba лежит LLVM (Low Level Virtual Machine) — популярная инфраструктура компиляции. Numba анализирует ваш Python-код, генерирует для него LLVM-представление и компилирует в машинный код непосредственно во время выполнения программы. Главная особенность — почти полное отсутствие необходимости изменять существующий код. Установка Numba довольно проста:

Python
1
pip install numba

После установки можно сразу приступать к оптимизации. Основной инструмент Numba — декоратор @jit (Just-In-Time):

Python
1
2
3
4
5
6
7
8
9
10
11
from numba import jit
 
@jit
def calculate_sum(n):
    total = 0
    for i in range(n):
        total += i
    return total
 
# Первый вызов скомпилирует функцию
result = calculate_sum(1000000)

При первом вызове функции Numba компилирует её в машинный код. Последующие вызовы используют уже скомпилированную версию, что обеспечивает серьезный прирост производительности. Но что если мы хотим еще больше ускорить код? Для этого существует декоратор @njit — это сокращение от @jit(nopython=True). Этот режим запрещает обращаться к Python API, гарантируя, что весь код будет выполняться на уровне машинных инструкций:

Python
1
2
3
4
5
6
7
8
from numba import njit
 
@njit  # Эквивалентно @jit(nopython=True)
def fast_function(x, y):
    result = 0.0
    for i in range(len(x)):
        result += x[i] * y[i]
    return result

Если при использовании @njit Numba не может скомпилировать весь код без обращения к Python API, она выдаст ошибку. Это полезно для выявления участков, которые трудно оптимизировать.
Разница между @jit и @njit может быть значительной. Рассмотрим пример:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
import numpy as np
from numba import jit, njit
import time
 
def python_function(arr):
    result = np.zeros_like(arr)
    for i in range(len(arr)):
        result[i] = np.sqrt(arr[i])
    return result
 
@jit
def jit_function(arr):
    result = np.zeros_like(arr)
    for i in range(len(arr)):
        result[i] = np.sqrt(arr[i])
    return result
 
@njit
def njit_function(arr):
    result = np.zeros_like(arr)
    for i in range(len(arr)):
        result[i] = np.sqrt(arr[i])
    return result
 
# Тестирование
arr = np.random.random(1000000)
 
start = time.time()
python_result = python_function(arr)
print(f"Python: {time.time() - start:.4f} сек")
 
start = time.time()
jit_result = jit_function(arr)
print(f"JIT: {time.time() - start:.4f} сек")
 
start = time.time()
njit_result = njit_function(arr)
print(f"NJIT: {time.time() - start:.4f} сек")

Типичные результаты могут быть такими: Python — 0.5 сек, JIT — 0.1 сек, NJIT — 0.01 сек. Ускорение в 5-50 раз!
Но настоящая мощь Numba раскрывается при параллельных вычислениях. В отличие от обычного Python, где GIL ограничивает производительность потоков, Numba позволяет запускать реально параллельные вычисления:

Python
1
2
3
4
5
6
7
8
9
from numba import njit, prange
 
@njit(parallel=True)
def parallel_sum(arr):
    result = 0.0
    # prange вместо range для параллельного выполнения
    for i in prange(len(arr)):
        result += arr[i]
    return result

Обратите внимание на использование prange вместо обычного range. Это указывает Numba, что итерации цикла можно распределить между ядрами процессора. При этом не нужно беспокоиться о синхронизации потоков или распределении нагрузки — Numba делает это за вас. Результаты могут быть впечатляющими. На современном 8-ядерном процессоре параллельная версия может работать в 5-7 раз быстрее последовательной (не достигая теоретических 8x из-за накладных расходов на создание потоков и синхронизацию).

Но что если даже этой производительности недостаточно? Тут на помощь приходит CUDA — технология параллельных вычислений от NVIDIA, позволяющая задействовать мощь графического процессора.
Numba предоставляет декоратор @cuda.jit для компиляции функций, выполняемых на GPU:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
from numba import cuda
import numpy as np
 
@cuda.jit
def increment_by_one(arr):
    i = cuda.grid(1)  # Получаем индекс текущего потока
    if i < arr.size:  # Проверяем границы массива
        arr[i] += 1
        
# Создаем массив на CPU
data = np.ones(1000000, dtype=np.float32)
 
# Копируем данные на GPU
d_data = cuda.to_device(data)
 
# Запускаем ядро с 256 потоками в блоке и достаточным количеством блоков
threads_per_block = 256
blocks_per_grid = (data.size + threads_per_block - 1) // threads_per_block
increment_by_one[blocks_per_grid, threads_per_block](d_data)
 
# Копируем результат обратно на CPU
result = d_data.copy_to_host()

Пример выше демонстрирует ключевые аспекты работы с CUDA:
1. Использование декоратора @cuda.jit.
2. Функция cuda.grid() для определения индекса текущего потока.
3. Копирование данных между CPU и GPU с cuda.to_device() и copy_to_host().
4. Запуск ядра с указанием размеров сетки и блока.

Хотя код для GPU сложнее, он может обеспечить ускорение в десятки и сотни раз для задач с большим параллелизмом, таких как обработка изображений или матричные вычисления.
Прежде чем оптимизировать код с Numba, важно определить, какие участки действительно требуют ускорения. Для этого используется профилирование. Python предоставляет встроенный модуль cProfile:

Python
1
2
3
4
5
6
7
8
9
import cProfile
 
def slow_function(n):
    result = 0
    for i in range(n):
        result += i * i
    return result
 
cProfile.run('slow_function(1000000)')

Это даст детальную статистику, показывающую, сколько времени заняла функция. Для более наглядного представления можно использовать пакет snakeviz:

Bash
1
2
python -m cProfile -o profile.prof script.py
snakeviz profile.prof

После выявления узких мест можно оценить эффект от применения Numba. Для этого используем модуль timeit:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
import timeit
import numpy as np
from numba import njit
 
def python_version(x):
    return np.sin(x) * np.sqrt(x)
 
@njit
def numba_version(x):
    return np.sin(x) * np.sqrt(x)
 
x = np.random.random(1000000)
 
# Прогрев для компиляции
numba_version(x)
 
# Измерение производительности
py_time = timeit.timeit('python_version(x)', globals=globals(), number=100)
nb_time = timeit.timeit('numba_version(x)', globals=globals(), number=100)
 
print(f"Python: {py_time:.4f} сек")
print(f"Numba: {nb_time:.4f} сек")
print(f"Ускорение: {py_time / nb_time:.1f}x")

По умолчанию Numba кэширует скомпилированный код, что ускоряет повторные запуски программы. Кэш хранится в директории __pycache__ или .cache/numba. Можно контролировать кэширование с помощью параметра cache:

Python
1
2
3
@njit(cache=True)  # Включить кэширование (по умолчанию)
def cached_function(x):
    return x * x

Кэширование особенно полезно для скриптов, запускаемых регулярно, так как позволяет избежать повторной компиляции при каждом запуске.

Несмотря на все преимущества, Numba имеет свои ограничения. Она поддерживает не все функции Python и библиотек. В режиме nopython доступны:

Основные типы данных (int, float, complex).
Кортежи, списки и словари (с некоторыми ограничениями).
Функции NumPy для работы с массивами.
Некоторые функции из math и других стандартных модулей.

Но не работают:

Большинство классов из стандартной библиотеки.
Пользовательские классы (за исключением jitclass).
Многие структуры данных из сторонних библиотек.
Генераторы и декораторы.

Для обхода этих ограничений можно:
1. Разбить код на части, компилируя только критичные участки.
2. Использовать numba.jitclass для компиляции простых классов.
3. Переписать код с использованием поддерживаемых функций.
4. Использовать object mode там, где nopython mode не работает.

Рассмотрим более глубоко стратегии обхода ограничений Numba. Основная сложность при работе с этой технологией заключается в том, что не все конструкции Python поддерживаются в режиме nopython. К счастью, почти всегда существуют обходные пути. Одно из типичных ограничений — работа с пользовательскими классами. Здесь на помощь приходит numba.jitclass который превращает Python-класс в эффективную C-структуру:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
from numba import int32, float64
from numba.experimental import jitclass
 
# Определяем спецификацию полей класса
spec = [
    ('x', float64),
    ('y', float64),
    ('count', int32)
]
 
@jitclass(spec)
class Point:
    def __init__(self, x, y):
        self.x = x
        self.y = y
        self.count = 0
        
    def move(self, dx, dy):
        self.x += dx
        self.y += dy
        self.count += 1
        
    def distance(self, other):
        return ((self.x - other.x)[B]2 + (self.y - other.y)[/B]2)**0.5
 
# Использование
@njit
def compute_distances(points):
    n = len(points)
    result = np.zeros(n * (n-1) // 2)
    idx = 0
    for i in range(n):
        for j in range(i+1, n):
            result[idx] = points[i].distance(points[j])
            idx += 1
    return result

Заметьте, что для jitclass требуется явно указать типы всех атрибутов. Это ограничивает гибкость, но значительно увеличивает производительность. Для работы со сложной логикой, которую сложно реализовать в nopython режиме, можно комбинировать скомпилированный и обычный Python-код:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
from numba import njit
 
# Эта функция компилируется в машинный код
@njit
def fast_calculation(data):
    result = np.zeros_like(data)
    for i in range(len(data)):
        result[i] = data[i] ** 2 + np.sqrt(data[i])
    return result
 
# А здесь используется обычный Python
def process_dataset(filename):
    # Сложная логика чтения файла и предобработки
    data = read_and_preprocess(filename)
    
    # Критичная к производительности часть делегируется Numba
    result = fast_calculation(data)
    
    # Постобработка и сохранение результатов
    return postprocess_and_save(result)

Такой гибридный подход часто оказывается наиболее практичным: сложную логику и взаимодействие с внешними системами оставляем на Python, а узкие места оптимизируем с Numba.
Ещё одна проблема — ограниченная поддержка функций стандартной библиотеки. Решение: реализовать эти функции самостоятельно

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
from numba import njit
import numpy as np
 
# Python-версия использует встроенные функции
def python_stats(data):
    return np.mean(data), np.median(data), np.std(data)
 
# Numba-версия реализует их вручную
@njit
def numba_stats(data):
    n = len(data)
    # Среднее
    mean = 0.0
    for i in range(n):
        mean += data[i]
    mean /= n
    
    # Стандартное отклонение
    var = 0.0
    for i in range(n):
        var += (data[i] - mean) ** 2
    std = np.sqrt(var / n)
    
    # Медиана (требует сортировки)
    sorted_data = np.sort(data)  # Numba поддерживает np.sort
    if n % 2 == 0:
        median = (sorted_data[n//2-1] + sorted_data[n//2]) / 2
    else:
        median = sorted_data[n//2]
    
    return mean, median, std

Для некоторых задач удобно использовать Numba вместе с Dask — библиотекой для параллельных и распределённых вычислений

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import dask.array as da
from numba import njit
 
@njit
def complex_function(x):
    # Сложные вычисления с каждым элементом
    return x**3 - 2*x**2 + 3*x - 4
 
# Создаем большой распределенный массив
x = da.random.random((10000, 10000), chunks=(1000, 1000))
 
# Применяем скомпилированную функцию ко всему массиву
result = x.map_blocks(lambda block: complex_function(block))
 
# Запускаем вычисления
result.compute()

Эта комбинация позволяет масштабировать оптимизированные вычисления на целые кластеры.
Отдельно стоит упомянуть векторизацию в Numba. Векторизация — это особый тип оптимизации, при котором вычисления выполняются сразу над целыми векторами данных благодаря SIMD-инструкциям (Single Instruction, Multiple Data):

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
from numba import njit, vectorize, float64
 
# Стандартная функция с циклом
@njit
def scalar_function(a, b):
    result = np.empty_like(a)
    for i in range(len(a)):
        result[i] = a[i] * b[i] + np.sin(a[i])
    return result
 
# Векторизованная версия
@vectorize([float64(float64, float64)])
def vector_function(a, b):
    return a * b + np.sin(a)
 
# Тестирование
a = np.random.random(1000000)
b = np.random.random(1000000)
 
# Сравниваем производительность

Декоратор @vectorize создаёт универсальную функцию (ufunc), которая может автоматически использовать SIMD-инструкции процессора. Для современных CPU с поддержкой AVX или AVX-512 это даёт существенное ускорение, так как позволяет обрабатывать 4-16 операций с плавающей точкой за один такт.

При отладке кода с Numba часто возникают неочевидные проблемы. Вот несколько советов:
1. Начинайте с простого кода без Numba, убедитесь, что логика работает.
2. Добавляйте @njit и запускайте функцию с простыми входными данными.
3. Если возникает ошибка, попробуйте @jit без режима nopython.
4. Для детального анализа используйте флаг debug:

Python
1
2
3
4
@njit(debug=True)
def problematic_function(x):
    # Ваш код
    return result

5. Если функция не компилируется, используйте пошаговый подход: выделяйте проблемные участки в отдельные функции и тестируйте их изолированно.

Интересным приёмом является создание полиморфных функций, которые адаптируются к разным типам данных:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
from numba import njit, int64, float64
 
@njit
def smart_sum(x):
    total = 0  # Тип определяется на этапе компиляции
    for i in range(len(x)):
        total += x[i]
    return total
 
# Автоматически создаются две версии функции
ints = np.array([1, 2, 3], dtype=np.int64)
floats = np.array([1.1, 2.2, 3.3], dtype=np.float64)
 
smart_sum(ints)   # Используется целочисленная версия
smart_sum(floats) # Используется версия с плавающей точкой

Numba компилирует отдельную версию функции для каждой комбинации типов аргументов, что позволяет достичь оптимальной производительности без потери гибкости.
Наконец, для полного контроля над процессом компиляции можно использовать API низкого уровня:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
from numba import njit, types
from numba.core.registry import CPUDispatcher
 
# Создаем функцию
def add(a, b):
    return a + b
 
# Получаем прокси-объект диспетчера
dispatcher = njit(add)
 
# Компилируем для конкретных типов
compiled_int = dispatcher.compile((types.int64, types.int64))
compiled_float = dispatcher.compile((types.float64, types.float64))
 
# Используем скомпилированные функции
result1 = compiled_int(1, 2)
result2 = compiled_float(1.5, 2.5)

Этот низкоуровневый подход позволяет более тонко управлять процессом компиляции, предварительно компилируя функции для ожидаемых типов данных. Важный практический совет: при интеграции Numba в существующие проекты лучше начинать с небольших, изолированных функций, постепенно расширяя область применения. Такой инкрементальный подход минимизирует риски и позволяет оценить реальную выгоду от оптимизации на раннем этапе.

Сравнение подходов на реальных задачах

Теория оптимизации хороша, но что происходит, когда дело доходит до реальных задач? Давайте рассмотрим Cython и Numba в действии на практических примерах, чтобы понять, где какой инструмент показывает себя лучше.
Начнём с классической задачи линейной алгебры — умножения матриц. Это операция, встречающаяся повсеместно: от научных расчётов до компьютерной графики и машинного обучения.

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
import numpy as np
import time
 
# Исходная Python/NumPy функция
def matrix_multiply_numpy(A, B):
    return A @ B
 
# Numba-версия
from numba import njit
 
@njit
def matrix_multiply_numba(A, B):
    return A @ B
 
# Cython-версия (предполагается, что уже скомпилирована)
# Код в файле matrix_cy.pyx:
"""
import numpy as np
cimport numpy as cnp
 
def matrix_multiply_cython(cnp.ndarray[double, ndim=2] A, cnp.ndarray[double, ndim=2] B):
    return A @ B
"""
 
# Тестирование
A = np.random.rand(1000, 1000)
B = np.random.rand(1000, 1000)
 
# Прогрев для Numba
_ = matrix_multiply_numba(A, B)
 
start = time.time()
C_numpy = matrix_multiply_numpy(A, B)
numpy_time = time.time() - start
 
start = time.time()
C_numba = matrix_multiply_numba(A, B)
numba_time = time.time() - start
 
# Для Cython предполагаем импорт из скомпилированного модуля
# from matrix_cy import matrix_multiply_cython
# start = time.time()
# C_cython = matrix_multiply_cython(A, B)
# cython_time = time.time() - start

В этом простом примере результаты могут удивить: Numba и Cython покажут практически идентичную производительность, сравнимую с чистым NumPy. Почему? Потому что NumPy уже использует оптимизированные C-библиотеки вроде BLAS для матричных операций. Здесь Cython и Numba просто передают вызов этим библиотекам, не добавляя существенной оптимизации.
Но картина меняется, когда мы переходим к операциям, которые NumPy не может векторизовать эффективно:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
# Вычисление расстояния Левенштейна между строками
def levenshtein_python(s1, s2):
    if len(s1) < len(s2):
        return levenshtein_python(s2, s1)
    
    if len(s2) == 0:
        return len(s1)
    
    previous_row = range(len(s2) + 1)
    for i, c1 in enumerate(s1):
        current_row = [i + 1]
        for j, c2 in enumerate(s2):
            insertions = previous_row[j + 1] + 1
            deletions = current_row[j] + 1
            substitutions = previous_row[j] + (c1 != c2)
            current_row.append(min(insertions, deletions, substitutions))
        previous_row = current_row
    
    return previous_row[-1]
 
# Cython-версия будет аналогична, но с добавлением типизации
# Numba-версия
@njit
def levenshtein_numba(s1, s2):
    # Аналогичный код, но с типами, которые Numba может скомпилировать
    # (в данном случае мы должны конвертировать строки в массивы символов)
    a = np.array(list(s1))
    b = np.array(list(s2))
    # ...остальной код...

В этом случае и Cython, и Numba могут дать значительное ускорение — от 10 до 100 раз по сравнению с чистым Python. Но тут уже проявляются различия: Cython требует больше изменений в коде, но обычно даёт лучшую производительность, особенно если использовать С-стиль программирования.
Рассмотрим ещё один пример — обработку большого набора данных. Типичная задача анализа — группировка и агрегация данных:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
import pandas as pd
import numpy as np
from numba import njit
 
# Создадим синтетический набор данных
n = 10_000_000
df = pd.DataFrame({
    'id': np.random.randint(0, 1000, n),
    'value': np.random.random(n)
})
 
# Python/Pandas версия
def aggregate_pandas(df):
    return df.groupby('id')['value'].agg(['mean', 'std', 'count'])
 
# Numba-версия требует работы с массивами
@njit
def aggregate_numba(ids, values):
    # Предварительное вычисление количества уникальных id
    # и создание массивов для результатов
    # ...код здесь...
    return means, stds, counts
 
# Для Cython потребуется более сложный код с явной типизацией и,
# возможно, использованием C-структур данных

При работе с большими наборами данных обнаруживается интересная закономерность: для простых операций над всем набором данных пакеты вроде Pandas, использующие векторизованные операции, могут быть достаточно быстрыми. Но когда требуется сложная логика, особенно с группировкой и условиями, выигрыш от использования Cython или Numba становится значительным. В какой же ситуации какой инструмент предпочтительнее?

Cython стоит выбирать, когда:

Необходима максимальная производительность.
Есть время на тщательную оптимизацию кода.
Требуется интеграция с C/C++ библиотеками.
Нужен точный контроль над типами и памятью.
Код будет развиваться и поддерживаться длительное время.

Numba подойдет, если:

Нужна быстрая оптимизация с минимальными изменениями.
Работа преимущественно с NumPy-массивами.
Важна простота в обслуживании кода.
Требуется поддержка параллельных вычислений или CUDA.
Код периодически меняется, и пересборка была бы неудобна.

Интересен случай оптимизации алгоритмов машинного обучения. Например, реализация метода k-ближайших соседей с нуля:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
import numpy as np
from numba import njit
 
@njit(parallel=True)
def knn_predict_numba(train_data, train_labels, test_data, k):
    n_test = len(test_data)
    n_train = len(train_data)
    predictions = np.zeros(n_test, dtype=np.int64)
    
    for i in range(n_test):
        # Вычисляем расстояния от текущей тестовой точки до всех тренировочных
        distances = np.zeros(n_train)
        for j in range(n_train):
            dist = 0.0
            for d in range(train_data.shape[1]):
                diff = train_data[j, d] - test_data[i, d]
                dist += diff * diff
            distances[j] = np.sqrt(dist)
        
        # Находим индексы k ближайших точек
        nearest_indices = np.argsort(distances)[:k]
        
        # Голосование: определяем наиболее частый класс
        nearest_labels = train_labels[nearest_indices]
        unique_labels, counts = np.unique(nearest_labels, return_counts=True)
        predictions[i] = unique_labels[np.argmax(counts)]
    
    return predictions

Эта реализация с Numba может работать в десятки раз быстрее, чем на чистом Python, особенно благодаря параллелизации. Cython-версия была бы сложнее в реализации, но потенциально ещё быстрее за счёт более тонкой оптимизации.

Правильная методология сравнения производительности — ключевой момент при выборе инструмента. Важно не только измерять время выполнения, но и учитывать использование памяти, масштабируемость и затраты на разработк. Базовый подход к измерению времени:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
import time
 
def benchmark(func, *args, repeats=5):
    times = []
    for _ in range(repeats):
        start = time.time()
        result = func(*args)
        end = time.time()
        times.append(end - start)
    
    return {
        'mean': np.mean(times),
        'min': np.min(times),
        'max': np.max(times),
        'std': np.std(times)
    }
 
# Использование
results_python = benchmark(python_function, data, repeats=10)
results_numba = benchmark(numba_function, data, repeats=10)
results_cython = benchmark(cython_function, data, repeats=10)

Для более точных измерений стоит использовать модуль timeit или специализированные библиотеки вроде pytest-benchmark. А для контроля памяти — модуль memory_profiler.

При интеграции оптимизированного кода в веб-приложения возникают особые требования. Например, при разработке API на Flask или Django критична не только скорость обработки запроса, но и время холодного старта функций. Тут Numba с отложенной компиляцией может проиграть:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
from flask import Flask, request, jsonify
import numpy as np
from numba import njit
 
app = Flask(__name__)
 
@njit(cache=True)  # Кэширование критично для веб-приложений!
def process_data(data):
    # Тяжелые вычисления
    result = np.zeros_like(data)
    for i in range(len(data)):
        result[i] = np.sqrt(data[i]) * np.log(1 + data[i])
    return result
 
@app.route('/analyze', methods=['POST'])
def analyze():
    data = np.array(request.json['data'], dtype=np.float64)
    result = process_data(data)
    return jsonify({'result': result.tolist()})

Первый запрос будет обрабатываться заметно дольше из-за JIT-компиляции. В продакшене это решается "прогревом" – предварительным вызовом функций при старте сервера:

Python
1
2
3
# При инициализации приложения
dummy_data = np.random.random(100)
_ = process_data(dummy_data)  # Прогреваем JIT-компилятор

Cython в этом сценарии выигрывает – скомпилированный модуль готов к работе сразу после импорта. Но разработка становится медленнее из-за необходимости перекомпиляции при каждом изменении.
Особый случай – рекурсивные алгоритмы, традиционно проблемные для Python. Здесь Cython особенно хорош:

C
1
2
3
4
5
6
7
8
9
10
# factorial.pyx
def factorial_python(n):
    if n <= 1:
        return 1
    return n * factorial_python(n - 1)
 
cpdef int factorial_cython(int n) nogil:
    if n <= 1:
        return 1
    return n * factorial_cython(n - 1)

Ключевое слово nogil позволяет выполнять рекурсию без блокировки GIL, что критично для эффективности. Numba также справляется с рекурсией:

Python
1
2
3
4
5
@njit
def factorial_numba(n):
    if n <= 1:
        return 1
    return n * factorial_numba(n - 1)

Но на сложных рекурсивных структурах вроде деревьев или графов начинаются проблемы. Cython лучше поддерживает сложные структуры данных, а Numba часто требует их переписывания под массивы.
Что касается потребления памяти, оно часто становится узким местом при работе с большими данными. Не всё о производительности можно понять, измеряя только время:

Python
1
2
3
4
5
6
7
8
9
10
from memory_profiler import profile
 
@profile
def memory_hungry_function(size):
    # Создаем большие массивы
    array1 = np.random.random((size, size))
    array2 = np.random.random((size, size))
    # Выполняем операции
    result = np.dot(array1, array2)
    return result

Запуск с аннотацией @profile покажет потребление памяти на каждой строке. Это важно, т.к. оптимизированный Numba-код иногда потребляет больше памяти из-за создания промежуточных буферов. Интересный аспект – "скрытые издержки". Например, при работе с CUDA через Numba существует латентность копирования данных между CPU и GPU:

Python
1
2
3
4
5
6
7
8
9
10
11
12
@cuda.jit
def cuda_kernel(array_in, array_out):
    # CUDA-оптимизированный код
    
def process_with_gpu(data):
    # Время копирования данных на GPU
    d_data = cuda.to_device(data)
    # Выполнение вычислений
    d_result = cuda.device_array_like(d_data)
    cuda_kernel[blocks, threads](d_data, d_result)
    # Время копирования результата обратно
    result = d_result.copy_to_host()

Для маленьких массивов накладные расходы на копирование могут превысить выигрыш от параллельных вычислений.
Также стоит учитывать вторичные факторы, влияющие на выбор технологии. Например, если команда с опытом C++, то переход на Cython будет органичнее. А для дата-сайентистов, привыкших к NumPy, Numba будет интуитивно понятнее.

В конечном счете, оптимальный выбор зависит не только от технических характеристик, но и от специфики проекта, команды и долгосрочных планов. Иногда наилучшим решением становится гибридный подход: критичные узкие места обрабатываются Cython, а остальная оптимизация делается через Numba – так сохраняется баланс между производительностью и скоростью разработки.

Практические выводы и рекомендации

Выбор между Cython и Numba — это всегда компромисс между простотой использования, гибкостью и максимальной производительностью. Проанализировав особенности обоих инструментов, можно сформулировать несколько ключевых рекомендаций. Прежде всего, не стоит оптимизировать код преждевременно. Профилирование должно стать первым шагом — выявите реальные узкие места, требующие ускорения. Часто оптимизация всего 5-10% кода дает 80-90% прироста производительности.

При выборе технологии учитывайте характер задачи. Для интенсивных числовых вычислений с массивами Numba часто является оптимальным решением из-за простоты использования и поддержки параллелизма. Добавление одного декоратора @njit может ускорить функцию в десятки раз без изменения логики. Cythonтребует больше изменений в исходном коде, но предлагает максимальный контроль и производительность, сравнимую с C/C++. Особенно эффективен Cython при интеграции с существующими C-библиотеками и оптимизации сложных алгоритмов с пользовательскими структурами данных. Для долгосрочных проектов стоит рассмотреть гибридный подход: использовать Numba для быстрой оптимизации вычислительно-интенсивных участков, а Cython — для критически важных компонентов, где каждая миллисекунда на счету.

Не забывайте о подводных камнях. Numba имеет ограничения по поддерживаемым конструкциям Python, а компиляция "на лету" создает задержки при первом запуске. Cython требует отдельного шага компиляции при каждом изменении кода и усложняет отладку. При разработке приложений для конечных пользователей убедитесь, что оптимизированный код правильно упакован и все зависимости разрешены. Для Cython это означает включение предкомпилированных бинарных модулей, а для Numba — корректную настройку LLVM-бэкенда.

Независимо от выбранного инструмента, помните о балансе между скоростью выполнения, читаемостью кода и скоростью разработки. Иногда более простой алгоритм на чистом Python может быть предпочтительнее сложного оптимизированного решения, особенно если производительность не критична, а поддерживаемость важна.

Ошибка при установке пакета numba
здравствуйте, прочитал на ресурсе # ускорять код Python, чтобы ускорить функцию, надо перед её...

Valueerror cannot compute fingerprint of empty list Numba
Решил попробовать ускорить код при помощи Numba, но получаю ошибку Cписок точно не пустой, т.к до...

Python. Оптимизация кода
Здравствуйте всем! Я недавно начал заниматься питоном и во время решения одной из моих задач,...

Оптимизация кода Python, цикла for
Здравствуйте! :) Я относительно недавно в программировании, подскажите как можно оптимизировать...

Оптимизация кода для GPU Python
Здравствуйте, проблема в том, что не получается оптимизировать под gpu, данный модуль кода...

Оптимизация кода Python (делаем красивый код)
Приветствую знатоков! Ниже простенькая программа на python 3.8.10, рабочая. :) (zip с кодом...

Изменение кода запроса с Python 2 на Python 3
Доброго времени суток. Я пишу программу и для её реализации мне необходимо, чтобы она делала...

Перевод кода из Pascal в Python - Python
Имеется код программы на языке Pascal, требуется перевести его в Python. Я не могу перевести его в...

Перевод кода с C++ на Python - Python
#include <iostream> #include <fstream> #include <string> #include <cstdlib> using namespace...

Есть код на Java- нужна реализация кода Python на основе кода
Посоветуйте какой-то софт или же напишите мне кто шарит в пайтоне для помощи реализации

Оптимизация и производительность Python
Здравствуйте. Ребят, всё чаще понимаю, что я всё больше и больше нуждаюсь в Python. Я изучаю C++,...

Оптимизация словаря python
Доброго времени суток, у меня проблема :( Задача: В одном мес n дней и m праздников Каждый...

Метки cpu, cython, hardware, numba, python

Размещено в Без категории

« Dictionary Comprehensions в Python Главная страница Автоматизация Amazon Web Services (AWS) с Boto3 в Python »

Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.

Всего комментариев 0

Комментарии

Новые блоги и статьи Все статьи Все блоги /
Транскрипция 55-минутного видео через Whisper: WhisperDesktop облажался, спас Google Colab[ anaschu 01.06.2026 Понадобилось получить текст из свежезагруженного видео на YouTube. Казалось бы, задача на пять минут. Заняла полтора часа. Делюсь опытом — может кому пригодится последовательность решений. . . .	21 мат мед. Планы на развитие модели здравоСохранения anaschu 01.06.2026 AnyLogic: план развития симуляционной модели рабочего коллектива — динамический абсентеизм, реальные данные, три сценария сравнения Продолжаю серию постов о дискретно-событийной модели рабочего. . .	20. Мат мед. Абсентеизм как отдельный тип простоя anaschu 29.05.2026 Апдейт модели: исправленные баги, абсентеизм и новые механизмы Продолжаю развивать ранее описанную модель рабочего коллектива на AnyLogic. За последние несколько дней был проведён серьёзный. . .	19. здоровье, усталость и психотип работника влияют на производительность предприятия, и наоборот, производительность на здоровье, усталось и психотип anaschu 28.05.2026 Дискретно-событийная модель рабочего коллектива на AnyLogic: здоровье, выгорание, психотипы и микростимуляция Привет, коллеги. Хочу поделиться итогами нескольких недель работы над симуляционной. . .
"Прокси" для последовательного порта Eddy_Em 28.05.2026 Эту штуку написал я достаточно давно. Но сейчас вот понадобилось настроить датчик грозы, но при этом не отключать его от "метеодемона". Соответственно, надо запустить этот "прокси": метеодемон будет. . .	Рефакторинг программы уравнивания. Massaraksh7 26.05.2026 Пример по предыдущей записи в блоге. Но, надо заметить, что, во-первых, там оптимизация не только математики, но и работы с базой данных, и с графами, а во-вторых, это ещё не всё.	Использование TThread в Lazarus для математических вычислений. Massaraksh7 25.05.2026 Производя рефакторинг своих программ на предмет ускорения их работы, обратил внимание на такой аспект, как сокращение времени матвычислений. Дело в том, что приходится работать с большими матрицами. . .	Модель здравосохранения 18. Чем здоровее работник, тем быстрее выгорает anaschu 24.05.2026 Имитационная модель корпоративного здравоохранения: что показывает математика Сегодня в модели рабочего коллектива на AnyLogic появились три новые механики — выгорание через накопленную усталость,. . .

Сообщение форума

Отменить изменения