我有一个包含项目和功能(属性)的数据集。每个项目都有一些功能。
功能总数~400功能。
我想根据功能的重要性对功能进行排名。我不是在寻找分类,我正在寻找功能排名。
我将项目特征转换为二进制矩阵,如下图所示,其中1表示此项目中存在此功能,否则为0。
itemID | feature1 | feature2 | feature3 | feature4 ....
1 | 0 | 1 | 1 | 0
2 | 1 | 0 | 0 | 1
3 | 1 | 1 | 1 | 0
4 | 0 | 0 | 1 | 1
真实数据的一个例子是酒店,其中的功能可能是:空调,免费WiFi等。
HotelID | Air Condition| Free WiFi ....
1 | 0 | 1
2 | 1 | 0
3 | 1 | 1
4 | 0 | 0
.....
我需要知道使用什么以及如何使用它。
非常感谢示例代码
答案 0 :(得分:0)