按照Siraj的演示:这里是我最适合单变量数据的代码
(可以找到文件here):
#import dependencies
import pandas as pd
from sklearn import linear_model
import matplotlib.pyplot as plt
#read data
dataframe = pd.read_fwf('brain_body.txt')
x_values = dataframe[['Brain']]
y_values = dataframe[['Body']]
#train model on data
body_reg = linear_model.LinearRegression()
body_reg.fit(x_values, y_values)
#visualize results
plt.scatter(x_values, y_values)
plt.plot(x_values, body_reg.predict(x_values))
plt.show()
我一直在搞这个烂摊子:
答案 0 :(得分:0)
感谢Darren O' Rourke的回答
由于pandas库似乎有所不同,numpy为我解决了这个问题。
import numpy as np
x_values = np.array(x_values)
y_values = np.array(y_values)
我希望这能解决问题。
干杯
答案 1 :(得分:-1)
我看起来很相似。来这里看是否有人发布了一些帮助。问题似乎与2个异常值(2547-4603和6654-5712)有关,因为它们明显更高。