Sklearn回归输入"找到具有暗淡的数组3.估计的估计量< = 2"

时间:2016-11-11 18:00:18

标签: python numpy scikit-learn

我试图解析此文件http://www4.stat.ncsu.edu/~boos/var.select/diabetes.rwrite1.txt以运行多功能回归,但我得到了一个" ValueError:找到了带有dim的数组3.预计估计值< = 2 " 。顺便说一下,输入必须是浮点数吗?

database = open(r'diabetes.rwrite1.txt','r').readlines()[1:]
lstx = []
lsty = []
for line in database:
    splitted = line.split()
    lstx.append(splitted[0:9])
    lsty.append(float(splitted[10]))


x_ = np.array(lstx)[:, np.newaxis, 1:9]
x = x_.astype(float)
y = np.array(lsty) 
lr = LinearRegression()
lr.fit(x, y)

1 个答案:

答案 0 :(得分:0)

如果要预测连续变量,请使用LinearRegression。如果要预测类别,则需要使用LogisticRegression或RandomForestClassifier等分类器。

在sklearn中,这些名称中几乎总是有“分类器”。