标签: cluster-analysis scaling categorical-data
我必须在仅具有分类变量的数据集中形成聚类。一些类别变量本质上是序数性的(例如教育程度,并且条目为1,2,3,而其他变量只是一个热门编码特征,例如is_loan,其中条目为0或1s)。我需要以下方面的帮助:
我是数据科学领域的新手,并且很难找到解决这些问题的方法。