ПРИМЕНЕНИЕ МЕТОДА МАШИННОГО ОБУЧЕНИЯ ДЛЯ АНАЛИЗА И ИЗВЛЕЧЕНИЯ СЕМАНТИЧЕСКИХ СТРУКТУР ИЗ НАУЧНЫХ ТЕКСТОВ
DOI:
https://doi.org/10.32014/2024.2518-1726.303Ключевые слова:
автоматический анализ документов, машинное обу чение, DistilBART, обработка естественного языка, краткое описание текстаАннотация
В данной работе рассматривается метод извлечения краткого описания текста из научных документов с использованием модели DistilBART, представляющей собой усовершенствованную и сокращенную версию модели Bidirectional and Auto-Regressive Transformers (BART). Модель DistilBART, обученная на больших объемах текстовых данных, позволяет эффективно решать задачи обработки естественного языка (NLP), такие как обобщение текста, машинный перевод и генерация текста. В данной работе основное внимание уделяется применению DistilBART для анализа и извлечения краткого описания текста из научных документов. Цель данной работы заключается в разработке универсального инструмента на основе модели DistilBART, который будет эффективным в извлечении и структурировании информации из научных документов различных областей. Традиционные методы обработки текста часто оказываются недостаточно мощными и требуют значительных вычислительных ресурсов, что делает их неприменимыми для анализа больших объемов данных. Использование передовых моделей машинного обучения, таких как DistilBART, представляет собой значительный шаг вперед. Актуальность данной работы также обусловлена растущей потребностью в эффективных системах поддержки научных исследований. Извлечение краткого описания текста с помощью DistilBART может существенно повысить качество аналитических обзоров, упростить поиск релевантной литературы и способствовать более глубокому пониманию исследовательских вопросов. В итоге, это способствует ускорению научного прогресса и повышению эффективности работы в различных областях науки и техники.