标签: r feature-selection information-gain
给定N行的输入文件,格式如下:
N
doc_id, class, text
class字段只有两个值[0,1](即两个类)
class
text字段由一组以空格分隔的术语组成。
text
如何使用R计算数据集中每个唯一术语与每个类之间的互信息。