МӘТІНДІК СИПАТТАМАЛАРҒА НЕГІЗДЕЛГЕН ГЕНЕРАТИВТІ ҚАРСЫЛАС ЖЕЛІЛЕРДІ ПАЙДАЛАНЫП КЕСКІНДЕРДІ ЖАСАУ
DOI:
https://doi.org/10.32014/2024.2518-1726.241Аннотация
Современные разработки в области обработки естественного языка (NLP) и компьютерного зрения (CV) подчеркивают важность создания изображений на основе текстовых описаний. В представленной статье анализируются два основных метода в этой области: генеративная состязательная сеть с условным латентным семантическим анализом (GAN-CLS) и сеть сверхдлинного преобразования (XLNet). Основные компоненты GAN-CLS, включая генератор, дискриминатор и кодировщик текста, обсуждаются в контексте их функциональных задач — создания изображений из текстовых входов, оценки достоверности сгенерированных изображений и преобразования текстовых признаков в соответствующие, скрытые космос. Был проведен сравнительный анализ производительности GAN-CLS и XLNet, последний широко используется в области органических светоизлучающих диодов (OEL). Цель исследования – определить эффективность каждого метода в различных сценариях, дать ценные рекомендации по выбору лучшего метода создания изображений из текстовых описаний с учетом конкретных задач и ресурсов.