ИДЕНТИФИКАЦИЯ ГОВОРЯЩЕГО С ИСПОЛЬЗОВАНИЕМ ГЕНЕРАЦИИ X-ВЕКТОРОВ С СОХРАНЕНИЕМ РАСПРЕДЕЛЕНИЯ

Авторы

  • Кыдырбекова А. ЮКУ имени М.О.Ауезова, Шымкент, Казахстан
  • Оралбекова Д. PhD, Институт информационных и вычислительных технологий, Алматы, Казахстан

DOI:

https://doi.org/10.32014/2024.2518-1726.314

Ключевые слова:

голосовая идентификация, конфиденциальность голоса, x-вектор.

Аннотация

С ростом использования голосовых помощников и интерфейсов разговорного языка возникли важные опасения относительно конфиденциальности голосовых данных. В попытке снизить угрозу атак на голосовые данные в этой статье предлагаем систему идентификации и аутентификации через х-вектора. Этот метод изменяет информацию о поле и акценте говорящего из исходного речевого сигнала. Предлагаемый метод дает более естественно звучащий анонимизированный голос в дополнение к деидентифицированному говорящему. Однако оно дает относительное улучшение EER до 19,30% для пар «идентизированный-анонимизированный регистрация-испытание». Мы наблюдали, что наряду с хорошей деидентификацией говорящего анонимизированные высказывания обладают адекватной разборчивостью речи и естественностью. Наш метод может быть легко интегрирован с другими в качестве компонента идентификации системы и устраняет необходимость в распределении говорящих для использования во время идентификации.

Загрузки

Опубликован

2024-12-04

Как цитировать

Kydyrbekova, A., & Oralbekova, D. (2024). ИДЕНТИФИКАЦИЯ ГОВОРЯЩЕГО С ИСПОЛЬЗОВАНИЕМ ГЕНЕРАЦИИ X-ВЕКТОРОВ С СОХРАНЕНИЕМ РАСПРЕДЕЛЕНИЯ. Известия НАН РК. Серия физико-математическая, (4), 152–162. https://doi.org/10.32014/2024.2518-1726.314