功能(属性)排名

时间:2017-07-25 16:58:18

标签: machine-learning weka feature-selection

我有一个包含项目和功能(属性)的数据集。每个项目都有一些功能。

功能总数~400功能。

我想根据功能的重要性对功能进行排名。我不是在寻找分类,我正在寻找功能排名。

我将项目特征转换为二进制矩阵,如下图所示,其中1表示此项目中存在此功能,否则为0。

itemID | feature1 | feature2 | feature3 | feature4 .... 1 | 0 | 1 | 1 | 0 2 | 1 | 0 | 0 | 1 3 | 1 | 1 | 1 | 0 4 | 0 | 0 | 1 | 1

真实数据的一个例子是酒店,其中的功能可能是:空调,免费WiFi等。

HotelID | Air Condition| Free WiFi .... 1 | 0 | 1 2 | 1 | 0 3 | 1 | 1 4 | 0 | 0 .....

我需要知道使用什么以及如何使用它。

非常感谢示例代码

1 个答案:

答案 0 :(得分:0)

看起来您正在寻找Information Gain等算法。 摘自班级文件:

  

通过测量信息增益来评估属性的价值   关于班级

您可以在此处找到一个用法示例:

http://www.programcreek.com/java-api-examples/index.php?api=weka.attributeSelection.InfoGainAttributeEval

祝你好运。