ОНЛАЙН КОНТЕНТТЕГІ БЕЙӘДЕП СӨЗДЕР МӘЛІМЕТТЕР ҚОРЫН DATA MINING АРҚЫЛЫ АНАЛИЗДЕУ
DOI:
https://doi.org/10.32014/2023.2518-1726.196Ключевые слова:
Түйін сөздер: бейәдеп мазмұнды сөздер, анықтау, онлайн контент, анализдеу, Data MiningАннотация
Аннотация. Состояние обеспечения информационно-психологической безопасности общества снижается из-за ежедневного увеличения деструктивных слов в сети Интернет. То есть определены такие категории, как пропаганда насилия по признаку расы, этнической принадлежности, национального происхождения, пола, гендерной идентичности, религии, возраста, инвалидности или болезни. Он показывает, что поиск и идентификация неречевых слов может осуществляться с минимальными усилиями с точки зрения испытуемого, так как теперь это может быть достигнуто автоматически с использованием различных методов. Рассмотрены существующие методы (экспертный анализ, интеллектуальные методы обработки данных), отмечены преимущества и недостатки этих методов. Кроме того, он не только исследует корни нецензурной лексики, но также предлагает концепции, помогающие различать типы оскорбительного языка, такие как ненормативная лексика и киберзапугивание. Мы используем подходы машинного обучения для доступа к наборам данных, которые мы можем использовать для автоматического сбора ненормативной лексики в социальных сетях. Для решения этой проблемы предлагается Data Mining для поиска оскорбительных слов, например, матерных слов в текстовых базах данных. Видно, что представленный метод отличается возможностью автоматического заполнения словарного запаса через систему при выявлении незнакомых слов, отнесенных к нестандартным. Правильность пополнения словарного запаса измеряется с помощью различных показателей. Мы создаем набор пользователей Интернета в Казахстане, которые используют социальные сети и СМИ, чтобы поделиться своим мнением. Описание предлагаемой исследовательской работы дано от сбора данных до классификации и выявления наборов слов деструктивного содержания.