МӘТІНДІК СИПАТТАМАЛАРҒА НЕГІЗДЕЛГЕН ГЕНЕРАТИВТІ ҚАРСЫЛАС ЖЕЛІЛЕРДІ ПАЙДАЛАНЫП КЕСКІНДЕРДІ ЖАСАУ

Авторы

  • А.С. Баегизова
  • А.Х. Касымова Западно-Казахстанский аграрно-техническии университет им. Жангир хана, Уральск, Казахстан
  • А.М. Бисенгалиева
  • Б.О. Мухаметжанова
  • М.Ж. Базарова

DOI:

https://doi.org/10.32014/2024.2518-1726.241

Аннотация

Современные разработки в области обработки естественного языка (NLP) и компьютерного зрения (CV) подчеркивают важность создания изображений на основе текстовых описаний. В представленной статье анализируются два основных метода в этой области: генеративная состязательная сеть с условным латентным семантическим анализом (GAN-CLS) и сеть сверхдлинного преобразования (XLNet). Основные компоненты GAN-CLS, включая генератор, дискриминатор и кодировщик текста, обсуждаются в контексте их функциональных задач — создания изображений из текстовых входов, оценки достоверности сгенерированных изображений и преобразования текстовых признаков в соответствующие, скрытые космос. Был проведен сравнительный анализ производительности GAN-CLS и XLNet, последний широко используется в области органических светоизлучающих диодов (OEL). Цель исследования – определить эффективность каждого метода в различных сценариях, дать ценные рекомендации по выбору лучшего метода создания изображений из текстовых описаний с учетом конкретных задач и ресурсов.  

Загрузки

Опубликован

2024-03-20

Как цитировать

Баегизова, А., Касымова, А., Бисенгалиева, . А. ., Мухаметжанова, . Б. ., & Базарова , М. . (2024). МӘТІНДІК СИПАТТАМАЛАРҒА НЕГІЗДЕЛГЕН ГЕНЕРАТИВТІ ҚАРСЫЛАС ЖЕЛІЛЕРДІ ПАЙДАЛАНЫП КЕСКІНДЕРДІ ЖАСАУ. Доклады НАН РК. Физико-математическая серия, (1), 43–58. https://doi.org/10.32014/2024.2518-1726.241