有几列包含测试值,例如使用的付款方式以及使用的折扣类型。 很少有人为了得到一个想法而粘贴这些条目。
Mode_of_payment discount_used
ICICI CREDIT CARD FGShoppingFest
Payback FGShoppingFest,T24Club
CASH FGShoppingFest,BBProfitClub
CASH FGShoppingFest,Payback
ICICI CREDIT CARD FGShoppingFest
CreditNote FGShoppingFest
CASH FGShoppingFest,Payback
CASH FGShoppingFest,T24Club,Payback
Cash Back FGShoppingFest
Cash Back FGShoppingFest,T24Club,Payback
Cash Back FGShoppingFest,T24Club
CASH FGShoppingFest,Payback
有关这些列的信息 - 什么是使用的付款方式和折扣使用列 - 可以在产品上应用单个折扣或多个折扣。
我想从这些列中提取信息,以便可以对其应用群集。 如何将其转换为数字数据?
答案 0 :(得分:0)
别。如果您的数据不是数字,请选择不需要数字变量的方法。
虽然您可以使用虚拟变量对它们进行编码,但大多数聚类算法(如k-means)都需要连续变量。您不能只将符号值转换为有意义的连续变量。