我计算了用户一天的可能出现状态(H:= Home,w:= Work或E:= Elsewhere)的用户行为的熵级别。假设用户A在一天中的每个小时都有其可能的状态,如{H,H,H,H,H,H,H,H,H,W,W,W,W,W,W,W,W, W,E,E,H,H,H,H}
P(H)= 13/24 = 0.54
P(W)= 9/24 = 0.38
P(E)= 2/24 = 0.08
使用shannon的熵,我想计算用户的熵级别,以确定用户的可预测性。
H(A)=( - P(H)* log2(H))+( - P(W)* log2(W))+( - P(E)* log2(E))
=0.48 + 0.53 + 0.29
=1.3
如何将这些信息分为低熵或高熵?
答案 0 :(得分:1)
当所有事件同样可能时,实现最大熵,因此结果具有最高的不确定性
在您的情况下,最大熵是:
Hn = log2(24) = 4.5849625007
最小值为0.由您自行决定结果是否可归类为高或低熵。