我试图解析此文件http://www4.stat.ncsu.edu/~boos/var.select/diabetes.rwrite1.txt以运行多功能回归,但我得到了一个" ValueError:找到了带有dim的数组3.预计估计值< = 2 " 。顺便说一下,输入必须是浮点数吗?
database = open(r'diabetes.rwrite1.txt','r').readlines()[1:]
lstx = []
lsty = []
for line in database:
splitted = line.split()
lstx.append(splitted[0:9])
lsty.append(float(splitted[10]))
x_ = np.array(lstx)[:, np.newaxis, 1:9]
x = x_.astype(float)
y = np.array(lsty)
lr = LinearRegression()
lr.fit(x, y)
答案 0 :(得分:0)
如果要预测连续变量,请使用LinearRegression。如果要预测类别,则需要使用LogisticRegression或RandomForestClassifier等分类器。
在sklearn中,这些名称中几乎总是有“分类器”。