标签: dataset cluster-analysis numeric
我正在尝试在我的数据集上运行聚类算法。我的数据集是数据包集(源IP,目标,端口,类标签)。我想将这些数据从名义数据转换为数字数据。转换这些数据的正确技巧是什么?
答案 0 :(得分:0)
通常的方法是执行一个热编码。虽然这显然在数字上对数据进行编码,但它存在一些问题。