ОНЛАЙН КОНТЕНТТЕГІ БЕЙӘДЕП СӨЗДЕР МӘЛІМЕТТЕР ҚОРЫН DATA MINING АРҚЫЛЫ АНАЛИЗДЕУ

Авторы

  • А.B. Toktarova Международный Казахско-Турецкий Университет им. Ходжа Ахмет Ясауи

DOI:

https://doi.org/10.32014/2023.2518-1726.196

Ключевые слова:

Түйін сөздер: бейәдеп мазмұнды сөздер, анықтау, онлайн контент, анализдеу, Data Mining

Аннотация

Аннотация. Состояние обеспечения информационно-психологической безопасности общества снижается из-за ежедневного увеличения деструктивных слов в сети Интернет. То есть определены такие категории, как пропаганда насилия по признаку расы, этнической принадлежности, национального происхождения, пола, гендерной идентичности, религии, возраста, инвалидности или болезни. Он показывает, что поиск и идентификация неречевых слов может осуществляться с минимальными усилиями с точки зрения испытуемого, так как теперь это может быть достигнуто автоматически с использованием различных методов. Рассмотрены существующие методы (экспертный анализ, интеллектуальные методы обработки данных), отмечены преимущества и недостатки этих методов. Кроме того, он не только исследует корни нецензурной лексики, но также предлагает концепции, помогающие различать типы оскорбительного языка, такие как ненормативная лексика и киберзапугивание. Мы используем подходы машинного обучения для доступа к наборам данных, которые мы можем использовать для автоматического сбора ненормативной лексики в социальных сетях. Для решения этой проблемы предлагается Data Mining для поиска оскорбительных слов, например, матерных слов в текстовых базах данных. Видно, что представленный метод отличается возможностью автоматического заполнения словарного запаса через систему при выявлении незнакомых слов, отнесенных к нестандартным. Правильность пополнения словарного запаса измеряется с помощью различных показателей. Мы создаем набор пользователей Интернета в Казахстане, которые используют социальные сети и СМИ, чтобы поделиться своим мнением. Описание предлагаемой исследовательской работы дано от сбора данных до классификации и выявления наборов слов деструктивного содержания.

Загрузки

Опубликован

2023-06-30

Как цитировать

Toktarova, A. (2023). ОНЛАЙН КОНТЕНТТЕГІ БЕЙӘДЕП СӨЗДЕР МӘЛІМЕТТЕР ҚОРЫН DATA MINING АРҚЫЛЫ АНАЛИЗДЕУ. Известия НАН РК. Серия физико-математическая, (2), 237–251. https://doi.org/10.32014/2023.2518-1726.196