КЛАССИФИКАЦИЯ ЦИФРОВЫХ ДОКУМЕНТОВ НА ОСНОВЕ ИСПОЛЬЗОВАНИЯ АЛГОРИТМА DEEP LEARNING

CLASSIFICATION OF DIGITAL DOCUMENTS USING DEEP LEARNING ALGORITHM

Авторы

  • А.С. Баймаханова 1Қожа Ахмет Ясауи атындағы Халықаралық қазақ-түрік университеті, Түркістан, Қазақстан
  • A.Ж. Сейтмуратов Қорқыт Ата атындағы Қызылорда университеті, Қызылорда, Қазақстан

DOI:

https://doi.org/10.32014/2022.2518-1726.152

Ключевые слова:

глубокое обучение, AlexNet, NLP, CNN, цифровые документы

Аннотация

Классификация документов является важным процессом для многих организаций при хранении цифровых документов. В ходе исследования создается технология отработки использования алгоритмов глубокого обучения. Документы сначала классифицируются визуально, затем документы, не классифицированные на первом этапе, классифицируются с использованием обработки естественного языка (NLP). Среди них количество групп около 20, а количество документов около 10 000. Исследования ведутся, начиная с одностраничного документа. На первом этапе документы классифицируются визуально, на втором этапе неклассифицируемые документы пытались классифицировать с помощью обработки естественного языка (NLP). Комплект упражнений был создан с использованием около 20 классификационных документов вручную. Исследования проводились на одностраничных документах. Выполняя исполнения, документ полностью измеряется с помощью AlexNet, в ½ и 1/3 экспериментов получается NLP для классификации изображений, пакета слов и алгоритма LSTM. Показатели исследования классифицируются по разным вариантам, которые соответственно измеряются. При успешности 75% и 85% должны быть выполнены первый и второй этапы соответственно. При изменении архитектуры AlexNet нам приходится вручную вводить некоторый текст в документы, которые невозможно классифицировать. По результатам, полученным в исследовательской работе, в CNN группа документов определяется с определенной вероятностью. Другими словами, нам нужна группа документов, удовлетворяющих определенному значению вероятности. Актуальность темы в цифровых архивах классификация документов является важным процессом для многих организаций по хранению документов. Классификация изображений документов с обновленной AlexNet состоит из восьми исследовательских слоев в архитектуре AlexNet, пяти сверточных и трех полностью аддитивных. Кроме того, в работе мы показали, что можно изменить первый уровень доступа оригинального AlexNet и получить наилучшие результаты.

Загрузки

Опубликован

2022-12-07

Как цитировать

Баймаханова, А. ., & Сейтмуратов A. . (2022). КЛАССИФИКАЦИЯ ЦИФРОВЫХ ДОКУМЕНТОВ НА ОСНОВЕ ИСПОЛЬЗОВАНИЯ АЛГОРИТМА DEEP LEARNING : CLASSIFICATION OF DIGITAL DOCUMENTS USING DEEP LEARNING ALGORITHM. Известия НАН РК. Серия физико-математическая, (4), 5–15. https://doi.org/10.32014/2022.2518-1726.152