作者swedrf0112 (M)
看板Database
标题[SQL ] 有趣性
时间Sun Sep 7 23:36:27 2014
想请问版友有人算过有趣性(Interestingness)的吗?
http://msdn.microsoft.com/zh-tw/library/ms175382.aspx
根据里面的说明,可以找到有趣性的公式为:
Interestingness(Attribute) = - (m - Entropy(Attribute)) *
(m - Entropy(Attribute))
m代表整个功能集的entropy (我不太懂这句的意思)
假设有两个变数 x=2,2,3,4,5,6
y=3,4,4,4,6,8
根据Shannon entropy H(x)= - sum_i p(x_i) * log_2( p(x_i) )
p(x_i)为X的pmf
X的entropy H(x)=2.251629
Y的entropy H(y)=1.792481
那请问m及x,y的interestingness是多少呢?
那麽Interestingness是越高越好? 还是越低越好?
因为感觉起来会为负数,跟我原本以为是正数不大一样
先谢谢各位了!!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 113.28.26.107
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/Database/M.1410104189.A.DF0.html
1F:推 GoalBased: 你发错地方了 09/08 13:16