КЛАССИФИКАЦИЯ ЦИФРОВЫХ ДОКУМЕНТОВ НА ОСНОВЕ ИСПОЛЬЗОВАНИЯ АЛГОРИТМА DEEP LEARNING
CLASSIFICATION OF DIGITAL DOCUMENTS USING DEEP LEARNING ALGORITHM
DOI:
https://doi.org/10.32014/2022.2518-1726.152Ключевые слова:
глубокое обучение, AlexNet, NLP, CNN, цифровые документыАннотация
Классификация документов является важным процессом для многих организаций при хранении цифровых документов. В ходе исследования создается технология отработки использования алгоритмов глубокого обучения. Документы сначала классифицируются визуально, затем документы, не классифицированные на первом этапе, классифицируются с использованием обработки естественного языка (NLP). Среди них количество групп около 20, а количество документов около 10 000. Исследования ведутся, начиная с одностраничного документа. На первом этапе документы классифицируются визуально, на втором этапе неклассифицируемые документы пытались классифицировать с помощью обработки естественного языка (NLP). Комплект упражнений был создан с использованием около 20 классификационных документов вручную. Исследования проводились на одностраничных документах. Выполняя исполнения, документ полностью измеряется с помощью AlexNet, в ½ и 1/3 экспериментов получается NLP для классификации изображений, пакета слов и алгоритма LSTM. Показатели исследования классифицируются по разным вариантам, которые соответственно измеряются. При успешности 75% и 85% должны быть выполнены первый и второй этапы соответственно. При изменении архитектуры AlexNet нам приходится вручную вводить некоторый текст в документы, которые невозможно классифицировать. По результатам, полученным в исследовательской работе, в CNN группа документов определяется с определенной вероятностью. Другими словами, нам нужна группа документов, удовлетворяющих определенному значению вероятности. Актуальность темы в цифровых архивах классификация документов является важным процессом для многих организаций по хранению документов. Классификация изображений документов с обновленной AlexNet состоит из восьми исследовательских слоев в архитектуре AlexNet, пяти сверточных и трех полностью аддитивных. Кроме того, в работе мы показали, что можно изменить первый уровень доступа оригинального AlexNet и получить наилучшие результаты.