Excel数据导入对于运行线性回归不正确

时间:2019-08-13 16:29:42

标签: python

尝试通过从excel文件中读取数据来运行线性回归。但是随着NaN读取数据,并且创建了多个额外的列。

可用的样本数据

X   Y
160 799
70  355
220 1096
20  99
40  199
140 698
200 993
190 954
200 1004

输入了Python代码

import pandas as pd
from sklearn.linear_model import LinearRegression
data1= pd.read_excel("E:\\MSE\Sem IV\Machine Learning\exercise.xlsx",1)
x=data1['X']
y=data1['Y']
data1
x1 = x.values.reshape(-1,1)
y1 = y.values.reshape(-1,1)
model = LinearRegression().fit(x1,y1)
print('intercept: ',model.intercept_)
print('slope: ',model.coef_)

从excel读取数据获得的输出

    X        Y  Unnamed: 2  ...  Unnamed: 25  Unnamed: 26  Unnamed: 27
0    62      NaN         NaN  ...          NaN          NaN          NaN
1    41      NaN         NaN  ...          NaN          NaN          NaN
2    63      NaN         NaN  ...          NaN          NaN          NaN
3    89      NaN         NaN  ...          NaN          NaN          NaN
4    14      NaN         NaN  ...          NaN          NaN          NaN
5    31      NaN         NaN  ...          NaN          NaN          NaN
6    83      NaN         NaN  ...          NaN          NaN          NaN
7    97      NaN         NaN  ...          NaN          NaN          NaN

0 个答案:

没有答案