如何在python中对未标记的数据进行多类分类?

时间:2019-01-06 02:11:30

标签: python machine-learning classification regression logistic-regression

我有20种不同类型的数据(作为一列),其中20种有用的信息,我想使用logistic回归将其分类为10种不同的类,因此,我想显示其中的记录数每个班级。数据未标记。

183820,9.17101300730551E+018,9,7,79,169,2017,10,17,6,3,0,1,1,0,0,0,0,0,0,637126.9861,5399201
183821,9.17101300712351E+018,9,7,72,147,2017,10,8,6,3,6,2,0,1,1,0,0,0,0,639046.3051,5363761.

3 个答案:

答案 0 :(得分:2)

分割每一行并制作一张这样的表

table = []
with open('your.csv') as f:
    for l in line:
        table.append(l.split(','))

然后使用您喜欢的任何逻辑回归函数并获得结果。

答案 1 :(得分:1)

您可以从CSV文件中读取数据,然后尝试使用聚类方法进行分类。

答案 2 :(得分:-1)

尝试以下参考:

1)使用SVM基本模型http://arxiv.org/abs/1402.3144(在Neurocomputing中发布)的一种可靠的集成方法,用于从阳性和未标记的数据中学习

2)仅使用正数和未标记的数据来评估二进制分类器:http://arxiv.org/abs/1504.06837