Question

我对Python很陌生。我插入了一个csv文件，其中包含有关二手车的数据（价格，yearOfRegistration，powerPS，公里，型号，fuelType），并使用散点图可视化我的数据。 x轴应为公里，y轴为价格。运行我的代码后，x轴的标签看起来还不错（标签为20000、40000、60000等），而y轴的标签却没有。 y轴的标签包含整个数据行，一行看起来像这样：4500,1999,150,125000,3er，benzin，“ BMW ...”。

我试图重新标记y轴，但我认为问题存在于csv数据中？

那是我的代码：

import pandas as pd

df = pd.read_csv("./autos_prepared.csv")
#print(df)

print(df.head())

print(df["price"])


from IPython import get_ipython
get_ipython().run_line_magic('matplotlib', 'inline')

import matplotlib.pyplot as plt

plt.scatter(df["kilometer"], df["price"])
plt.show()

我期望有一个上述x轴的图，y轴上的标签分别为0、10000、20000、30000、40000。相反，我得到了上面描述的结果。

此外，我想补充一点

ValueError：输入包含NaN，无穷大或对于dtype（'float64'）而言太大的值。

尝试运行此代码后：

from sklearn.linear_model import LinearRegression

model = LinearRegression()
model.fit(df[["kilometer"]], df[["price"]])
#
print("Intercept: " + str(model.intercept_))
print("Coef: " + str(model.coef_))

有人可以帮助我吗？那就太好了！

Answer 1

我认为数据确实存在错误。现在问题解决了。我不知道到底是哪里出了问题，但是现在可以了。

pandas.read_csv y轴包含整个数据行和sklearn.linear模型ValueError

1 个答案: