pandas.read_csv y轴包含整个数据行和sklearn.linear模型ValueError

时间:2019-05-29 12:38:21

标签: python

我对Python很陌生。我插入了一个csv文件,其中包含有关二手车的数据(价格,yearOfRegistration,powerPS,公里,型号,fuelType),并使用散点图可视化我的数据。 x轴应为公里,y轴为价格。运行我的代码后,x轴的标签看起来还不错(标签为20000、40000、60000等),而y轴的标签却没有。 y轴的标签包含整个数据行,一行看起来像这样:4500,1999,150,125000,3er,benzin,“ BMW ...”。

我试图重新标记y轴,但我认为问题存在于csv数据中?

那是我的代码:

import pandas as pd

df = pd.read_csv("./autos_prepared.csv")
#print(df)

print(df.head())

print(df["price"])


from IPython import get_ipython
get_ipython().run_line_magic('matplotlib', 'inline')

import matplotlib.pyplot as plt

plt.scatter(df["kilometer"], df["price"])
plt.show()

我期望有一个上述x轴的图,y轴上的标签分别为0、10000、20000、30000、40000。相反,我得到了上面描述的结果。

此外,我想补充一点

ValueError:输入包含NaN,无穷大或对于dtype('float64')而言太大的值。

尝试运行此代码后:

from sklearn.linear_model import LinearRegression

model = LinearRegression()
model.fit(df[["kilometer"]], df[["price"]])
#
print("Intercept: " + str(model.intercept_))
print("Coef: " + str(model.coef_))

有人可以帮助我吗?那就太好了!

1 个答案:

答案 0 :(得分:0)

我认为数据确实存在错误。现在问题解决了。我不知道到底是哪里出了问题,但是现在可以了。