我有20种不同类型的数据(作为一列),其中20种有用的信息,我想使用logistic回归将其分类为10种不同的类,因此,我想显示其中的记录数每个班级。数据未标记。
183820,9.17101300730551E+018,9,7,79,169,2017,10,17,6,3,0,1,1,0,0,0,0,0,0,637126.9861,5399201
183821,9.17101300712351E+018,9,7,72,147,2017,10,8,6,3,6,2,0,1,1,0,0,0,0,639046.3051,5363761.
答案 0 :(得分:2)
分割每一行并制作一张这样的表
table = []
with open('your.csv') as f:
for l in line:
table.append(l.split(','))
然后使用您喜欢的任何逻辑回归函数并获得结果。
答案 1 :(得分:1)
您可以从CSV文件中读取数据,然后尝试使用聚类方法进行分类。
答案 2 :(得分:-1)
尝试以下参考:
1)使用SVM基本模型http://arxiv.org/abs/1402.3144(在Neurocomputing中发布)的一种可靠的集成方法,用于从阳性和未标记的数据中学习
2)仅使用正数和未标记的数据来评估二进制分类器:http://arxiv.org/abs/1504.06837