如何区分低熵和高熵与使用shannon熵产生的信息

时间:2014-03-10 14:31:03

标签: math machine-learning artificial-intelligence entropy

我计算了用户一天的可能出现状态(H:= Home,w:= Work或E:= Elsewhere)的用户行为的熵级别。假设用户A在一天中的每个小时都有其可能的状态,如{H,H,H,H,H,H,H,H,H,W,W,W,W,W,W,W,W, W,E,E,H,H,H,H}

P(H)= 13/24 = 0.54

P(W)= 9/24 = 0.38

P(E)= 2/24 = 0.08

使用shannon的熵,我想计算用户的熵级别,以确定用户的可预测性。

H(A)=( - P(H)* log2(H))+( - P(W)* log2(W))+( - P(E)* log2(E))

=0.48 + 0.53 + 0.29

=1.3

如何将这些信息分为低熵或高熵?

1 个答案:

答案 0 :(得分:1)

当所有事件同样可能时,实现最大熵,因此结果具有最高的不确定性

enter image description here

在您的情况下,最大熵是:

Hn = log2(24) = 4.5849625007

最小值为0.由您自行决定结果是否可归类为熵。