ОПТИМИЗАЦИЯ РАСЧЁТА КИНЕТИЧЕСКИХ УРАВНЕНИЙ ПРОЦЕССОВ ГОРЕНИЯ НА GPU С ИСПОЛЬЗОВАНИЕМ GLOBAL MEMORY И SHARED MEMORY
DOI:
https://doi.org/10.32014/2026.2518-1726.442Ключевые слова:
химическая кинетика, горение, GPU, CUDA, shared memory, global memory, Рунге–Кутта, Aramco_Mech, параллельные вычисления, кинетический солверАннотация
В статье рассматривается задача повышения вычислительной производительности при решении кинетических уравнений процессов горения на графических процессорах. Детальные химико-кинетические механизмы, применяемые для моделирования горения реальных топлив, могут включать сотни компонентов и тысячи элементарных реакций, что приводит к значительному увеличению времени расчёта при использовании традиционных CPU-методов. Для ускорения вычислений предложен CUDA-ориентированный подход, основанный на распределении реакций между потоками GPU и оптимизации доступа к памяти графического процессора.
В статье сравниваются три варианта вычислений: последовательный расчёт на CPU, параллельный расчёт на GPU с использованием global memory и параллельный расчёт на GPU с использованием shared memory. В качестве тестового механизма использован Aramco_Mech. Численные эксперименты проведены для механизмов различной размерности: от 33 компонентов и 118 реакций до 493 компонентов и 2716 реакций. Расчёты выполнялись на вычислительной системе с процессором AMD Ryzen 9 5950X 16-Core Processor, 128 ГБ оперативной памяти и графическим адаптером NVIDIA GeForce RTX 4080 Ti.
Полученные результаты показывают, что с увеличением числа реакций преимущество GPU-вычислений становится более выраженным. Для механизма, содержащего 493 компонента и 2716 реакций, время расчёта на CPU составило 1 сутки 4 часа 2 минуты 4 секунды 796 миллисекунд, тогда как время расчёта на GPU с использованием global memory составило 21 минуту 10 секунд 591 миллисекунду, а с использованием shared memory — 10 минут 51 секунду 585 миллисекунд. Ускорение составило 79,43 раза для global memory и 154,89 раза для shared memory. Полученные результаты подтверждают эффективность GPU-архитектуры и важность оптимальной организации памяти при решении больших систем химической кинетики.




