ПРИМЕНЕНИЕ МЕТОДА МАШИННОГО ОБУЧЕНИЯ ДЛЯ АНАЛИЗА И ИЗВЛЕЧЕНИЯ СЕМАНТИЧЕСКИХ СТРУКТУР ИЗ НАУЧНЫХ ТЕКСТОВ

Авторы

  • Айтимов М. PhD, старший преподаватель, Кызылординский университет имени Коркыт Ата, Кызылорда, Казахстан
  • Альменаева Р.У. PhD, старший преподаватель, Кызылординский университет имени Коркыт Ата, Кызылорда, Казахстан
  • Макулов К.К. к.э.н., и.о. ассоциированного профессора кафедры Компьютерные науки Каспийского Университета технологий и инжиниринга имени Ш. Есенова, Актау, Казахстан
  • Остаева А.Б. кандидат педагогических наук, старший преподаватель Кызылординского университета имени Коркыт Ата, Кызылорда, Казахстан
  • Муратхан Р. Карагандинский университет им. Е.А. Букетова, ассоциированный профессор, PhD, Караганда, Казахстан

DOI:

https://doi.org/10.32014/2024.2518-1726.303

Ключевые слова:

автоматический анализ документов, машинное обу чение, DistilBART, обработка естественного языка, краткое описание текста

Аннотация

В данной работе рассматривается метод извлечения краткого описания текста из научных документов с использованием модели DistilBART, представляющей собой усовершенствованную и сокращенную версию модели Bidirectional and Auto-Regressive Transformers (BART). Модель DistilBART, обученная на больших объемах текстовых данных, позволяет эффективно решать задачи обработки естественного языка (NLP), такие как обобщение текста, машинный перевод и генерация текста. В данной работе основное внимание уделяется применению DistilBART для анализа и извлечения краткого описания текста из научных документов. Цель данной работы заключается в разработке универсального инструмента на основе модели DistilBART, который будет эффективным в извлечении и структурировании информации из научных документов различных областей. Традиционные методы обработки текста часто оказываются недостаточно мощными и требуют значительных вычислительных ресурсов, что делает их неприменимыми для анализа больших объемов данных. Использование передовых моделей машинного обучения, таких как DistilBART, представляет собой значительный шаг вперед. Актуальность данной работы также обусловлена растущей потребностью в эффективных системах поддержки научных исследований. Извлечение краткого описания текста с помощью DistilBART может существенно повысить качество аналитических обзоров, упростить поиск релевантной литературы и способствовать более глубокому пониманию исследовательских вопросов. В итоге, это способствует ускорению научного прогресса и повышению эффективности работы в различных областях науки и техники.   

Загрузки

Опубликован

2024-12-03

Как цитировать

Айтимов, М., Альменаева, Р., Макулов, К., Остаева, А., & Муратхан, Р. (2024). ПРИМЕНЕНИЕ МЕТОДА МАШИННОГО ОБУЧЕНИЯ ДЛЯ АНАЛИЗА И ИЗВЛЕЧЕНИЯ СЕМАНТИЧЕСКИХ СТРУКТУР ИЗ НАУЧНЫХ ТЕКСТОВ. Известия НАН РК. Серия физико-математическая, (4), 5–16. https://doi.org/10.32014/2024.2518-1726.303