我有一个包含400个实例和1335个类的数据集,因此每个实例都具有多个类。我想实现一种监督分类算法,该算法指示每个实例对每个类的归属程度。我曾经考虑过使用skfuzzy(https://pythonhosted.org/scikit-fuzzy/auto_examples/plot_cmeans.html)的Fuzzy C均值,但是它根本无法说服我。
欢迎任何帮助或想法,谢谢!
答案 0 :(得分:1)
这种类型的问题属于多标签分类的类别。 您可以将multi-hot vector创建为目标变量,然后将此目标变量用于sklearn中支持multi-label classification的分类器之一。