ЭНТРОПИЙНО-НОРМАЛИЗОВАННАЯ МНОГОМЕРНАЯ МОДЕЛЬ ДЛЯ СЕГМЕНТАЦИИ АКТИВНОСТИ ПОЛЬЗОВАТЕЛЕЙ В REDDIT
DOI:
https://doi.org/10.32014/2026.2518-1726.433Ключевые слова:
энтропийное моделирование, степенные распределения, интегральный индекс активности, кластерный анализ, масштабно-инвариантные системыАннотация
В работе предлагается энтропийно - нормализованная многомерная модель сегментации пользовательской активности в социальной сети Reddit. Показано, что метрики вовлечённости (лайки и комментарии) обладают тяжёлохвостыми распределениями, что ограничивает применение классических статистических предположений. Для учёта данной особенности введён интегральный индекс активности, объединяющий стандартизированные показатели вовлечённости с нормированной энтропией Шеннона временного поведения. Предложенная модель позволяет одновременно учитывать интенсивность взаимодействия и временную регулярность активности пользователей. Сегментация выполняется методом KMeans, а качество кластеризации оценивается коэффициентом силуэта. Экспериментальный анализ подтверждает наличие масштабноинвариантных свойств распределений и демонстрирует улучшение разделимости кластеров по сравнению с использованием исходных признаков. Разработанный аналитический пайплайн является вычислительно масштабируемым и может применяться для интеллектуального анализа данных цифровых платформ




