我对Python很陌生。我插入了一个csv文件,其中包含有关二手车的数据(价格,yearOfRegistration,powerPS,公里,型号,fuelType),并使用散点图可视化我的数据。 x轴应为公里,y轴为价格。运行我的代码后,x轴的标签看起来还不错(标签为20000、40000、60000等),而y轴的标签却没有。 y轴的标签包含整个数据行,一行看起来像这样:4500,1999,150,125000,3er,benzin,“ BMW ...”。
我试图重新标记y轴,但我认为问题存在于csv数据中?
那是我的代码:
import pandas as pd
df = pd.read_csv("./autos_prepared.csv")
#print(df)
print(df.head())
print(df["price"])
from IPython import get_ipython
get_ipython().run_line_magic('matplotlib', 'inline')
import matplotlib.pyplot as plt
plt.scatter(df["kilometer"], df["price"])
plt.show()
我期望有一个上述x轴的图,y轴上的标签分别为0、10000、20000、30000、40000。相反,我得到了上面描述的结果。
此外,我想补充一点
ValueError:输入包含NaN,无穷大或对于dtype('float64')而言太大的值。
尝试运行此代码后:
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(df[["kilometer"]], df[["price"]])
#
print("Intercept: " + str(model.intercept_))
print("Coef: " + str(model.coef_))
有人可以帮助我吗?那就太好了!
答案 0 :(得分:0)
我认为数据确实存在错误。现在问题解决了。我不知道到底是哪里出了问题,但是现在可以了。