СРАВНИТЕЛЬНЫЙ АНАЛИЗ ЭФФЕКТИВНОСТИ НЕЙРОННЫХ СЕТЕЙ ПРИ НИЗКОМ ЗНАЧЕНИИ ОТНОШЕНИЯ С/Ш
DOI:
https://doi.org/10.32014/2024.2518-1726.315Ключевые слова:
искусственные нейронные сети, сверточная нейронная сеть, рекуррентная нейронная сеть, детектор голосовой активности, отношение сигнал/шумАннотация
Данная работа посвящена сравнительному анализу эффективности нейронных сетей CNN и RNN при низкомзначении отношения С/Ш. Проведенное исследование в рамках данной работы показало, что сверочные нейронные сети RNN демонстрируют более высокую эффективность в задачах распознавания речевого сигнала при низком уровне отношения С/Ш. Так, нейронная сеть RNN показала стабильное превосходство над CNN при низких значениях отношения С/Ш. Выявлено, что при отношении С/Ш = 6 дБ, точность распознавания с использованием RNN составила 82% для казахского языка, в то время как CNN показала результат в районе 77%.
Кроме того, результаты показали, что эффективность нейронных сетей CNN и RNN зависит от языка, на котором они обучались. Нейронные сети, обученные на казахском языке, показали лучшие результаты при распознавании казахской речи, но также успешно справлялись с распознаванием русского языка. Это подчеркивает важность учета языковых особенностей при разработке и обучении нейронных сетей, что может улучшить их производительность в многоязычных средах.
В рамках данного исследования установлено, что разные языки демонстрируют различные результаты при низком уровне С/Ш. Например, несмотря на родственную связь между казахским и кыргызскими языками, нейронная сеть RNN более успешно справлялся с распознаванием русского языка. Это может свидетельствовать о большом сходстве фонетических признаков между казахским и русским языками, чем между казахским и кыргызским. Данный результат требует дальнейшего детального исследования и анализа для выявления фонетических особенностей, влияющих на точность распознавания речевого сигнала.