OPTIMIZATION OF THE CALCULATION OF KINETIC EQUATIONS OF COMBUSTION PROCESSES ON GPU USING GLOBAL MEMORY AND SHARED MEMORY

M. Сарсембаев; Б. Урмашев

doi:10.32014/2026.2518-1726.442

Авторы

Сарсембаев М. исследователь кафедры компьютерных наук, Казахский национальный университет имени аль-Фараби, Алматы, Казахстан
Урмашев Б. кандидат физико-математических наук, профессор кафедры компьютерных наук, Казахский национальный университет имени аль-Фараби, Алматы, Казахстан

DOI:

https://doi.org/10.32014/2026.2518-1726.442

Ключевые слова:

химическая кинетика, горение, GPU, CUDA, shared memory, global memory, Рунге–Кутта, Aramco_Mech, параллельные вычисления, кинетический солвер

Аннотация

В статье рассматривается задача повышения вычислительной производительности при решении кинетических уравнений процессов горения на графических процессорах. Детальные химико-кинетические механизмы, применяемые для моделирования горения реальных топлив, могут включать сотни компонентов и тысячи элементарных реакций, что приводит к значительному увеличению времени расчёта при использовании традиционных CPU-методов. Для ускорения вычислений предложен CUDA-ориентированный подход, основанный на распределении реакций между потоками GPU и оптимизации доступа к памяти графического процессора.

В статье сравниваются три варианта вычислений: последовательный расчёт на CPU, параллельный расчёт на GPU с использованием global memory и параллельный расчёт на GPU с использованием shared memory. В качестве тестового механизма использован Aramco_Mech. Численные эксперименты проведены для механизмов различной размерности: от 33 компонентов и 118 реакций до 493 компонентов и 2716 реакций. Расчёты выполнялись на вычислительной системе с процессором AMD Ryzen 9 5950X 16-Core Processor, 128 ГБ оперативной памяти и графическим адаптером NVIDIA GeForce RTX 4080 Ti.

Полученные результаты показывают, что с увеличением числа реакций преимущество GPU-вычислений становится более выраженным. Для механизма, содержащего 493 компонента и 2716 реакций, время расчёта на CPU составило 1 сутки 4 часа 2 минуты 4 секунды 796 миллисекунд, тогда как время расчёта на GPU с использованием global memory составило 21 минуту 10 секунд 591 миллисекунду, а с использованием shared memory — 10 минут 51 секунду 585 миллисекунд. Ускорение составило 79,43 раза для global memory и 154,89 раза для shared memory. Полученные результаты подтверждают эффективность GPU-архитектуры и важность оптимальной организации памяти при решении больших систем химической кинетики.

ОПТИМИЗАЦИЯ РАСЧЁТА КИНЕТИЧЕСКИХ УРАВНЕНИЙ ПРОЦЕССОВ ГОРЕНИЯ НА GPU С ИСПОЛЬЗОВАНИЕМ GLOBAL MEMORY И SHARED MEMORY

Авторы

DOI:

Ключевые слова:

Аннотация

Загрузки

Опубликован

Как цитировать

Выпуск

Раздел

flags

menu