我正在尝试根据一些预先指定的标签对数据进行分类,得到4列,如下所示:
room_class room_cluster room_inb room_view
Standard single sea view Standard single sea
Deluxe twin Single Deluxe single -
Suite Superior room ocean view Suite - ocean
Superior Double twin Superior Double -
Deluxe Double room sea view Deluxe Double sea
之前我曾研究过一种基于Knn分类器的学习模型,只有一个功能列,如下所示:
room_class room_cluster
Standard single sea view Standard
Deluxe twin Single Deluxe
Suite Superior room ocean view Suite
Superior Double twin Superior
Deluxe Double room sea view Deluxe
在这里我首先将字符串值填充到数值上,因此将'room_class'设置为'Y',并'room_cluster'将是具有相同结构的'X'然后在其上运行Knn。但是现在我想利用的主数据上又追加了两行。如何合并这三行,即 room_cluster,room_inb,room_view 进入 X ,同时保持 room_class 为 Y ,然后在它们上训练模型。>
示例:训练后,模型应将输入分类为以下输出。
输入:海景双人高级套房
预期产量:
room_cluster:高级
room_inb:双人间
room_view:海洋
编辑:这是我针对单一功能集提出的问题:
Classification accuracy based on single Feature set