Известия НАН РК. Серия физико-математическая https://journals.nauka-nanrk.kz/physics-mathematics <p><strong>ISSN 2518-1726 (Online)</strong><br /><strong>ISSN 1991-346X (Print)</strong><br /><strong>Собственник:</strong> РОО «Национальная академия наук Республики Казахстан» (г. Алматы).<br /><strong>Тематическая направленность:</strong> публикация приоритетных научных исследований в области физико-математических наук и информационных технологий</p> <p><strong>Периодичность</strong>: 4 раза в год.</p> WEB-FORM ru-RU Известия НАН РК. Серия физико-математическая 1991-346X ПРИМЕНЕНИЕ МЕТОДА МАШИННОГО ОБУЧЕНИЯ ДЛЯ АНАЛИЗА И ИЗВЛЕЧЕНИЯ СЕМАНТИЧЕСКИХ СТРУКТУР ИЗ НАУЧНЫХ ТЕКСТОВ https://journals.nauka-nanrk.kz/physics-mathematics/article/view/6738 <p>В данной работе рассматривается метод извлечения краткого описания текста из научных документов с использованием модели DistilBART, представляющей собой усовершенствованную и сокращенную версию модели Bidirectional and Auto-Regressive Transformers (BART). Модель DistilBART, обученная на больших объемах текстовых данных, позволяет эффективно решать задачи обработки естественного языка (NLP), такие как обобщение текста, машинный перевод и генерация текста. В данной работе основное внимание уделяется применению DistilBART для анализа и извлечения краткого описания текста из научных документов. Цель данной работы заключается в разработке универсального инструмента на основе модели DistilBART, который будет эффективным в извлечении и структурировании информации из научных документов различных областей. Традиционные методы обработки текста часто оказываются недостаточно мощными и требуют значительных вычислительных ресурсов, что делает их неприменимыми для анализа больших объемов данных. Использование передовых моделей машинного обучения, таких как DistilBART, представляет собой значительный шаг вперед. Актуальность данной работы также обусловлена растущей потребностью в эффективных системах поддержки научных исследований. Извлечение краткого описания текста с помощью DistilBART может существенно повысить качество аналитических обзоров, упростить поиск релевантной литературы и способствовать более глубокому пониманию исследовательских вопросов. В итоге, это способствует ускорению научного прогресса и повышению эффективности работы в различных областях науки и техники.&nbsp;&nbsp;&nbsp;</p> М. Айтимов Р.У. Альменаева К.К. Макулов А.Б. Остаева Р. Муратхан Copyright (c) 2024 Известия НАН РК. Серия физико-математическая 2024-12-03 2024-12-03 4 5–16 5–16 10.32014/2024.2518-1726.303 МОДЕЛИРОВАНИЕ ЧЕЛОВЕЧЕСКОГО ПОВЕДЕНИЯ ДЛЯ СМАРТФОНА С ИСПОЛЬЗОВАНИЕМ АЛГОРИТМА МАШИННОГО ОБУЧЕНИЯ https://journals.nauka-nanrk.kz/physics-mathematics/article/view/7014 <p>Статья посвящена анализу и исследованию распознавания поведения человека с целью предоставления альтернативного способа идентификации и аутентификации пользователей смартфонов. Распознавание поведения включает в себя двухэтапный процесс: получение необработанных данных и извлечение характеристик и классификаций. Экспериментальные данные, использованные в этой статье, содержат один встроенный в смартфон акселерометр для определения моделей ходьбы пользователей. Вместо классических алгоритмов машинного обучения используется подход глубокого обучения. В статье предлагается новая модель CNN для идентификации пользователей на основе их моделей активности. В качестве экспериментального набора данных использовалась общедоступная идентификация пользователя из набора данных о ходьбе. Модель CNN достигла точности 99,88% при распознавании пользователя по шаблонам ходьбы. Статья также включает сравнительное исследование предлагаемой модели с классическими алгоритмами машинного обучения, такими как Ada-Boost, Decision Tree, GaussianNB, Linear Discriminant, Logistic Regression, Quadratic Discriminant, и Random Forest. Производительность распознавания случайного леса с точностью 95,78% стала близкой к предложенной модели. Но модель CNN более эффективна, чем случайный лес, с точки зрения времени и точности распознавания.</p> А.К. Айтим Г.К. Сембина Copyright (c) 2024 Physico-mathematical series 2024-12-03 2024-12-03 4 17–28 17–28 10.32014/2024.2518-1726.304 АНАЛИЗ И СРАВНЕНИЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ОБНАРУЖЕНИЯ ВРЕДОНОСНОГО ПО https://journals.nauka-nanrk.kz/physics-mathematics/article/view/6729 <p>Наше исследование направлено на анализ и оценку современных методов машинного обучения для обнаружения вредоносных программ, что является критической проблемой, учитывая растущую сложность и объем киберугроз. Традиционные подходы часто не справляются с новыми типами вредоносных программ, поэтому использование машинного обучения позволяет повысить эффективность защиты за счет выявления аномального поведения и неизвестных угроз в режиме реального времени. Методы машинного обучения открывают новые возможности для обнаружения угроз путем анализа поведенческих признаков файлов и сетевой активности. Кроме того, использование методов машинного обучения позволяет адаптироваться к новым типам угроз в режиме реального времени, что значительно повышает уровень безопасности и снижает риски для пользователей и организаций. Мы исследовали различные алгоритмы, включая методы опорных векторов, случайный лес, логистическую регрессию и деревья решений, сравнивая их эффективность при выявлении и классификации вредоносных программ. Наша методология объединяет статические, динамические и основанные на памяти методы анализа, предлагая комплексный подход к пониманию поведения вредоносных программ. Основные результаты показывают, что деревья решений и случайные леса демонстрируют впечатляющую точность как в бинарных, так и в<br />многоклассовых задачах классификации. Мы также выделяем новые методы, такие как Self-Organizing Incremental Neural Network, которая эффективно справляется с развивающимися угрозами вредоносных программ. Интеграция статических и динамических методов анализа углубляет понимание поведения вредоносных программ. Это исследование подчеркивает важность развития методов машинного обучения для улучшения мер кибербезопасности против развивающихся глобальных угроз вредоносных программ, предлагая ценную информацию для будущих направлений исследований.</p> Г. Акшолак А. Беделбаев Р. Магазов Copyright (c) 2024 Physico-mathematical series 2024-12-03 2024-12-03 4 29–41 29–41 10.32014/2024.2518-1726.305 ДОЗВУКОВЫЕ ВИБРОТРАНСПОРТНЫЕ РЕШЕНИЯ ВОЛНОВОГО УРАВНЕНИЯ В ПРОСТРАНСТВАХ РАЗМЕРНОСТИ N=1,2,3 https://journals.nauka-nanrk.kz/physics-mathematics/article/view/6922 <p>Исследуется воздействие &nbsp;вибротранспортных источников излучения волн в средах, которые связаны с движущимися обьектами, скорость движения которых может быть дозвуковой, звуковой, сверхзвуковой, а в средах с несколькими звуковыми скоростями (упругие, например) еще и трансзвуковой. Здесь строятся фундаментальные и регулярные вибротранспортные решения волнового уравнения при дозвуковых скоростях движения источника возмущений в пространствах физической размерности (<em>N</em>=1,2,3). Построены функции Грина, которые описывают динамику среды при движении сосредоточенного в точке источника, который движется с постоянной скоростью и вибрирует с постоянной частотой. На его основе построены общие решения вибротранспортного уравнения при действии как распределенных в пространстве движущихся виброисточников, так и сосредоточенных на движущихся поверхностях и линиях. Дано математическое описание эффекта Доплера с графической иллюстрацией.</p> <p>Построенные решения позволяют строить решения многих уравнений механики сплошных сред для такого типа движущихся источников возмущений в средах и найдут обширные применения при решении различных инженерно-технических задач</p> Л.А. Алексеева Copyright (c) 2024 Physico-mathematical series 2024-12-03 2024-12-03 4 42–59 42–59 10.32014/2024.2518-1726.306 АНАЛИЗ СИСТЕМ РАСПОЗНАВАНИЯ ПОЛИТИЧЕСКОГО ЭКСТРЕМИЗМА В СОЦИАЛЬНЫХ СЕТЯХ ОНЛАЙН https://journals.nauka-nanrk.kz/physics-mathematics/article/view/6672 <p>В статье рассматривается быстрый рост социальных сетей в интернете и их роль в распространении вредного и экстремистского контента. Ссылаясь на отчет Global Digital 2023, он подчеркивает рост глобального использования социальных сетей, в котором активно задействовано почти 60% населения. Хотя социальные сети предлагают множество преимуществ, они также стали платформой для распространения опасных идеологий, включая терроризм, кибербуллинг и экстремистские политические движения. В статье рассматривается, как экстремистские группы используют социальные сети для распространения пропаганды, вербовки подписчиков и подстрекательства к насилию, часто обходя ограничения платформы с помощью таких тактик, как использование популярных хэштегов или создание новых имен пользователей.<br />В статье также рассматриваются проблемы выявления и категоризации экстремистского контента, указывая на такие проблемы, как ненадежные наборы данных, отсутствие автоматизированных систем проверки и предвзятость в исследованиях. В ней рассматривается область исследований, сосредоточенная на обнаружении экстремистских материалов, включая инструменты для анализа жестоких видеороликов и экстремистских текстов. Кроме того, в статье обсуждаются различные формы экстремизма, встречающиеся в Казахстане — политические, национальные и религиозные — и то, как эти идеологии усиливаются в интернете. В статье отмечаются ограничения современных исследований экстремизма, такие как дисбаланс данных и методологические различия, которые мешают точному анализу. Также в статье предлагается разработка передовых программных решений для более эффективного выявления и нейтрализации экстремистского контента, тем самым внося вклад в глобальные усилия по борьбе с онлайнэкстремизмом и укреплению национальной безопасности.</p> К.Б. Багитова Ш.Ж. Мусиралиева К. Азанбай Copyright (c) 2024 Physico-mathematical series 2024-12-03 2024-12-03 4 60–72 60–72 10.32014/2024.2518-1726.307 ОЦЕНКА ЭФФЕКТИВНОСТИ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ОХВАТА КЛЮЧЕВЫХ СЛОВ https://journals.nauka-nanrk.kz/physics-mathematics/article/view/6819 <p>В данной статье осуществляется тщательный сравнительный анализ двух современных гибридных подходов в машинном обучении, такие как Bidirectional Encoder Representations from Transformers (BERT) в сочетании с автокодировщиком (Autoencoder, AE) и Термино-Частотное Обратное Документное Частотное (Term Frequency-Inverse Document Frequency, TF-IDF) в сочетании с автокодировщиком. Исследование фокусируется на задаче извлечения ключевых слов с применением методов семантического анализа текстовых данных. Основная цель работы заключается в оценке эффективности данных методов для обеспечения адекватного охвата ключевых слов в больших текстовых корпусах, охватывающих различные тематические области. Авторы подробно изучают архитектуру и принципы работы каждого из рассматриваемых методов. Особое внимание уделяется особенностям интеграции этих методов с автоэнкодерами, что позволяет значительно улучшить семантическую целостность и релевантность выделенных ключевых слов. Экспериментальная часть исследования включает в себя детальный анализ эффективности обоих методов на различных наборах текстовых данных, демонстрируя, как структура и семантическая насыщенность исходных данных влияют на результаты работы каждого из методов. В работе также подробно описывается примененная методология оценки качества извлечения ключевых слов, включая такие показатели, как точность, полнота и мера F1. Анализируются преимущества и недостатки каждого подхода, а также их пригодность для конкретных типов текстовых задач. Результаты исследования предоставляют ценные данные для научного сообщества и могут быть использованы для выбора наиболее подходящего метода обработки текстов в различных приложениях, где требуется глубокое понимание семантического содержания и высокая точность извлечения информации. &nbsp;</p> А.С. Баегизова Г.И. Мухамедрахимова И.М. Бапиев М.Ж. Базарова У.М. Смайлова Copyright (c) 2024 Physico-mathematical series 2024-12-03 2024-12-03 4 73–88 73–88 10.32014/2024.2518-1726.308 МОДЕЛИРОВАНИЕ ПРАВИЛ И УСЛОВИЙ ПРОВЕДЕНИЯ ПРЕДВЫБОРНЫХ ДЕБАТОВ https://journals.nauka-nanrk.kz/physics-mathematics/article/view/6666 <p>Это исследование, финансируемое в рамках проекта AP19679847 «Разработка методов анализа казахского политического дискурса», фокусируется на разработке передовых методик анализа политического дискурса в социальных сетях на казахском языке. В данной статье представлен всесторонний анализ и формализация процесса проведения предвыборных дебатов на примере Республики Казахстан, основанный на официальных правилах и условиях. В исследовании подчеркивается междисциплинарный характер анализа политического дискурса в социальных сетях, объединяющий знания из области политических и социальных наук, а также информатики.</p> <p>Особое внимание уделяется созданию онтологической модели предвыборных дебатов с использованием системы Protégé и RDF для структурирования знаний о дебатах. Это позволило выявить ключевые субъекты, их взаимосвязи и создать основу для разработки инструментов анализа настроений по темам выборов. Модель фокусируется на ответах на ключевые вопросы, связанные с организацией и проведением дебатов, что делает ее ценным инструментом для оптимизации политических стратегий и повышения эффективности избирательных кампаний в будущем.</p> Г.Т. Бекманова Б.Ж. Ергеш Г.К. Елибаева А.С. Омарбекова S. Martin Copyright (c) 2024 Physico-mathematical series 2024-12-03 2024-12-03 4 89–98 89–98 10.32014/2024.2518-1726.309 ИСПОЛЬЗОВАНИЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ОБНАРУЖЕНИЯ ДЕСТРУКТИВНОГО ВЕБ-КОНТЕНТА НА КАЗАХСКОМ ЯЗЫКЕ https://journals.nauka-nanrk.kz/physics-mathematics/article/view/6673 <p>В статье комплексно рассматриваются проблемы выявления и анализа деструктивных сообщений в сети интернет. Авторы представляют эффективные алгоритмы автоматического сбора и маркировки текстовых данных агрессивного содержания. Этот интегрированный подход фокусируется на сбалансированном обучении моделей посредством сбора, обработки и построения целевых наборов данных. В ходе исследования было доказано, что предложенные алгоритмы достигли высокой точности по F-мере и эффективны при решении дисбаланса целевого класса. Деструктивные послания делятся на пять основных классов: издевательства, расизм, нацизм, насильственный экстремизм. В исследовании четко подчеркивается важность сбора этого контента из различных социальных сетей (YouTube, ВКонтакте, Telegram). Подчеркивается необходимость своевременного обнаружения с целью снижения негативного воздействия такой информации на общество и национальную безопасность. Авторы отмечают, что интернет стал инструментом экстремистских и террористических группировок для распространения идеологии и организации опасной деятельности, и анализируют способы борьбы с таким контентом.</p> <p>В статье акцентируется внимание на важности понимания и изучения динамики распространения агрессивной информации. Обоснована актуальность создания корпуса для анализа данных, полученных из открытых источников на казахском языке. Социальные сети и сбор данных рекомендуются как эффективный шаг на пути усиления мер безопасности, улучшения борьбы с экстремизмом и защиты информационного пространства. Авторы подчеркивают важность использования современных методов обработки данных для эффективного обнаружения агрессивной информации в глобальной сети. В данном исследовании представлены эффективные инструменты, направленные на предотвращение распространения агрессивного контента, укрепление национальной безопасности и защиту информационного пространства. Результаты исследования считаются важными для совершенствования аналитических мер и мер безопасности.</p> М. Болатбек М. Сағынай Ш. Мусиралиева Copyright (c) 2024 Physico-mathematical series 2024-12-03 2024-12-03 4 99–111 99–111 10.32014/2024.2518-1726.310