ФЕДЕРАТИВТІ ОҚЫТУ: ТРАНСФОРМЕР АРХИТЕКТУРАСЫНА НЕГІЗДЕЛГЕН МОДЕЛЬДЕР

А.Б. Омар; Ш.Ж. Мусиралиева

doi:10.32014/2026.2518-1726.440

Авторы

Омар А.Б. докторант кафедры кибербезопасности и криптологии, Казахский национальный университет имени аль-Фараби, Алматы, Казахстан
Мусиралиева Ш.Ж. кандидат физико-математических наук, профессор кафедры кибербезопасности и криптологии, Казахский национальный университет имени аль-Фараби, Алматы, Казахстан

DOI:

https://doi.org/10.32014/2026.2518-1726.440

Ключевые слова:

обработка естественного языка, федеративное обучение, модели трансформеров, равномерный набор данных, неравномерный набор данных, количество клиентов, скорость обучения

Аннотация

В ходе исследования были рассмотрены метод федеративного обучения и производительность моделей BERT, ALBERT и DistilBERT. В ходе эксперимента набор данных был разделён между 3, 5, 7 и 11 клиентами, что позволило рассмотреть два различных метода распределения данных. Первый — IID, основанный на равномерном распределении набора данных. Второй — Non-IID, который, напротив, характеризует неравномерное распределение данных.

Основной целью исследования является выявление и классификация агрессивного контента с использованием метода федеративного обучения. Для обучения представленных моделей был использован набор данных English Profanity Words. Описание набора данных представлено в разделе «Методы и материалы». В ходе эксперимента был проведён анализ точности моделей и скорости их обучения. Кроме того, набор данных был разделён двумя способами, и при постепенном увеличении числа клиентов исследовались изменения точности моделей.

В результате модель ALBERT показала лучшие результаты при увеличении числа клиентов. Модель BERT продемонстрировала стабильные результаты, а модель DistilBERT, несмотря на более высокую скорость обучения по сравнению с другими моделями, показала более низкую точность. Полученные результаты могут помочь в выборе подходящей модели при работе с конфиденциальными данными и использовании методов федеративного обучения.

ФЕДЕРАТИВНОЕ ОБУЧЕНИЕ: МОДЕЛИ НА ОСНОВЕ АРХИТЕКТУРЫ ТРАНСФОРМЕРОВ

Авторы

DOI:

Ключевые слова:

Аннотация

Загрузки

Опубликован

Как цитировать

Выпуск

Раздел

flags

menu