СРАВНИТЕЛЬНЫЙ АНАЛИЗ АРХИТЕКТУР ГЛУБОКОГО ОБУЧЕНИЯ ПРИ СЕГМЕНТАЦИИ ТРЕЩИН НА ДОРОЖНЫХ ПОКРЫТИЯХ
DOI:
https://doi.org/10.32014/2025.2518-1726.371Ключевые слова:
глубокое обучение, трещины, CrackNet, DeepCrack , YOLOv9, ViT-UNet, Swin-UNet, сегментация.Аннотация
Статья посвящена сравнительному анализу пяти передовых архитектур глубокого обучения, применяемых для сегментации трещин на дорожном покрытии: CrackNet, DeepCrack++, YOLOv9, ViT-UNet и Swin-UNet. Анализ проводился на основе нескольких общедоступных датасетов с различным уровнем разметки, а в качестве ключевых метрик использовались полнота (Recall), точность (Precision), среднее значение IoU и F1-мера. Согласно результатам экспериментов, модель DeepCrack++ продемонстрировала наивысшие значения полноты и точности, что указывает на её высокую эффективность в обнаружении различных типов повреждений с минимальным уровнем ложных срабатываний. В то же время CrackNet выделилась исключительной скоростью обработки и низким потреблением вычислительных ресурсов, что делает её особенно подходящей для использования в ресурсограниченных встраиваемых системах. Модель YOLOv9, адаптированная для сегментации как микро-, так и макротрещин, показала сбалансированные характеристики: высокую точность и сравнительно быстрое время обработки. ViT-UNet благодаря способности моделировать глобальный контекст с помощью механизмов внимания, обеспечила более детализированное выявление тонких и разветвлённых трещин. В свою очередь, Swin-UNet, эффективно объединяя локальные и глобальные признаки, продемонстрировала стабильную производительность на различных наборах данных. Таким образом, представленные результаты могут служить основой для выбора наиболее подходящей архитектуры при разработке интеллектуальных систем мониторинга состояния дорожной инфраструктуры, где необходимо учитывать соотношение между точностью, вычислительными затратами и временем отклика.




