СРАВНИТЕЛЬНОЕ АНАЛИЗ МНОГОЯЗЫЧНЫХ ТРАНСФОРМЕРНЫХ МОДЕЛЕЙ ДЛЯ ПЕРЕВОДА С КАЗАХСКОГО ЯЗЫКА НА ГЛОССИРОВАННОЕ ПРЕДСТАВЛЕНИЕ

Авторы

  • Турсынова Н. инженер-программист, Институт информационных и вычислительных технологий КН МНВО РК, Алматы, Казахстан; PhD-докторант, Евразийский национальный университет имени Л.Н. Гумилева, Астана, Казахстан
  • Еримбетова А. ведущий научный сотрудник, Институт информационных и вычислительных технологий КН МНВО РК, Алматы, Казахстан; PhD, кандидат технических наук, ассоциированный профессор, профессор-исследователь META University, Алматы, Казахстан
  • Амангелды Н. старший научный сотрудник, Институт информационных и вычислительных технологий КН МНВО РК, Алматы, Казахстан; PhD, исследователь, Евразийский национальный университет имени Л.Н. Гумилева, Астана, Казахстан
  • Жумабаева А. PhD, старший преподаватель, Евразийский национальный университет имени Л.Н. Гумилева, Астана, Казахстан
  • Дайырбаева Э. научный сотрудник, Институт информационных и вычислительных технологий КН МНВО РК, Алматы, Казахстан; магистр, старший преподаватель, Казахский национальный исследовательский технический университет имени К.И. Сатпаева, Алматы, Казахстан

DOI:

https://doi.org/10.32014/2026.2518-1726.446

Ключевые слова:

Казахский язык жестов, перевод текста в глосс, многоязычная платформа Transformer, оценка BLEU, обучение

Аннотация

:   Казахский язык жестов находится в центре внимания ученых. В последние десятилетия все больше внимания уделяется созданию технологий, способных устранить барьеры в общении и взаимодействии между людьми с ограниченными возможностями и обществом. Отсутствие параллельного корпуса в языке жестов открывает тему перевода текста в глосс для неотложных и углубленных исследований. К сожалению, цифровые технологии недоступны людям с нарушениями слуха и речи. Перевод текста в глосс по-прежнему актуален для казахского языка жестов. В частности, из-за того, что один язык жестов имеет несколько значений, синтез его в глосс в программной среде занимает много времени.

В данной статье рассматривается перевод текста в глосс с использованием пяти различных моделей на основе многоязычного трансформера. То есть изучается, являются ли модели быстрее или медленнее в чтении и потребляют ли они больше или меньше ресурсов. Для проведения эксперимента были выбраны модели mBART-large-50, M2M100-418M, mT5-base, MarianMT и T5-base. Все эти модели были обучены с использованием одинаковых параметров. Результаты оценивались с использованием широко распространенных метрик стандартов (BLEU, ROUGE-L и chrF++), а также был проведен качественный анализ моделей. В ходе исследования было установлено, что более крупные многоязычные модели обеспечивают более точный перевод. Хотя модели mBART-large-50 и M2M100-418M показали хорошие результаты, остальные, меньшие по размеру многоязычные модели, оказались быстрее и менее ресурсоемкими. Перевод текста в глоссарий по-прежнему актуален для казахского языка жестов. В частности, из-за того, что один язык жестов имеет несколько значений, синтез его в глоссарий в среде программирования занимает значительное количество времени.

Загрузки

Опубликован

2026-06-18

Как цитировать

Tursynova , N., Yerimbetova А., Amangeldy, N., Zhumabayeva , A., & Daiyrbayeva , E. (2026). СРАВНИТЕЛЬНОЕ АНАЛИЗ МНОГОЯЗЫЧНЫХ ТРАНСФОРМЕРНЫХ МОДЕЛЕЙ ДЛЯ ПЕРЕВОДА С КАЗАХСКОГО ЯЗЫКА НА ГЛОССИРОВАННОЕ ПРЕДСТАВЛЕНИЕ. Academic Scientific Journal of Computer Science, (2), 414–432. https://doi.org/10.32014/2026.2518-1726.446

Выпуск

Раздел

Информационно-коммуникационные технологии