尝试通过从excel文件中读取数据来运行线性回归。但是随着NaN读取数据,并且创建了多个额外的列。
可用的样本数据
X Y
160 799
70 355
220 1096
20 99
40 199
140 698
200 993
190 954
200 1004
输入了Python代码
import pandas as pd
from sklearn.linear_model import LinearRegression
data1= pd.read_excel("E:\\MSE\Sem IV\Machine Learning\exercise.xlsx",1)
x=data1['X']
y=data1['Y']
data1
x1 = x.values.reshape(-1,1)
y1 = y.values.reshape(-1,1)
model = LinearRegression().fit(x1,y1)
print('intercept: ',model.intercept_)
print('slope: ',model.coef_)
从excel读取数据获得的输出
X Y Unnamed: 2 ... Unnamed: 25 Unnamed: 26 Unnamed: 27
0 62 NaN NaN ... NaN NaN NaN
1 41 NaN NaN ... NaN NaN NaN
2 63 NaN NaN ... NaN NaN NaN
3 89 NaN NaN ... NaN NaN NaN
4 14 NaN NaN ... NaN NaN NaN
5 31 NaN NaN ... NaN NaN NaN
6 83 NaN NaN ... NaN NaN NaN
7 97 NaN NaN ... NaN NaN NaN