基于多个功能集对数据进行分类的问题

时间:2019-04-03 01:24:04

标签: python machine-learning scikit-learn classification knn

我正在尝试根据一些预先指定的标签对数据进行分类,得到4列,如下所示:

room_class                          room_cluster  room_inb   room_view

Standard single sea view            Standard      single     sea
Deluxe twin Single                  Deluxe        single     -
Suite Superior room ocean view      Suite           -        ocean
Superior Double twin                Superior      Double     -
Deluxe Double room sea view         Deluxe        Double     sea

之前我曾研究过一种基于Knn分类器的学习模型,只有一个功能列,如下所示:

room_class                          room_cluster 

Standard single sea view            Standard    
Deluxe twin Single                  Deluxe        
Suite Superior room ocean view      Suite           
Superior Double twin                Superior      
Deluxe Double room sea view         Deluxe      

在这里我首先将字符串值填充到数值上,因此将'room_class'设置为'Y',并'room_cluster'将是具有相同结构的'X'然后在其上运行Knn。但是现在我想利用的主数据上又追加了两行。如何合并这三行,即 room_cluster,room_inb,room_view 进入 X ,同时保持 room_class Y ,然后在它们上训练模型。

示例:训练后,模型应将输入分类为以下输出。

输入:海景双人高级套房

预期产量
    room_cluster:高级
    room_inb:双人间
    room_view:海洋

编辑:这是我针对单一功能集提出的问题:
Classification accuracy based on single Feature set

0 个答案:

没有答案