如何将Object列转换为数字以便在Python中进行聚类分析?

时间:2017-10-31 04:19:03

标签: python cluster-analysis

有几列包含测试值,例如使用的付款方式以及使用的折扣类型。 很少有人为了得到一个想法而粘贴这些条目。

  Mode_of_payment           discount_used
ICICI CREDIT CARD           FGShoppingFest
Payback             FGShoppingFest,T24Club
CASH                FGShoppingFest,BBProfitClub
CASH                FGShoppingFest,Payback
ICICI CREDIT CARD               FGShoppingFest
CreditNote              FGShoppingFest
CASH                FGShoppingFest,Payback
CASH                FGShoppingFest,T24Club,Payback
Cash Back               FGShoppingFest
Cash Back               FGShoppingFest,T24Club,Payback
Cash Back               FGShoppingFest,T24Club
CASH                FGShoppingFest,Payback

有关这些列的信息 - 什么是使用的付款方式和折扣使用列 - 可以在产品上应用单个折扣或多个折扣。

我想从这些列中提取信息,以便可以对其应用群集。 如何将其转换为数字数据?

1 个答案:

答案 0 :(得分:0)

别。如果您的数据不是数字,请选择不需要数字变量的方法。

虽然您可以使用虚拟变量对它们进行编码,但大多数聚类算法(如k-means)都需要连续变量。您不能只将符号值转换为有意义的连续变量。