我在A列中有一个大约一百万个数列的csv文件(excel电子表格)。我想用y轴上的数字频率和数字上的数量来制作这些数据的直方图。 x轴上。我正在使用熊猫这样做。我的代码:
import pandas as pd
pd.read_csv('D1.csv', quoting=2)['A'].hist(bins=50)
Python并没有将'A'解释为列名。我已经尝试了各种名称来引用该列,但都会导致关键字错误。我错过了一个步骤,我必须通过python为该列分配一个名称,我不知道如何?
答案 0 :(得分:0)
我需要更多代表发表评论,所以我把它作为答案。 您需要有一个标题行,其中包含您要在pandas上使用的名称。此外,如果你想在使用python shell或ipython工作时看到直方图,你需要导入pyplot
import matplotlib.pyplot as plt
import pandas as pd
pd.read_csv('D1.csv', quoting=2)['A'].hist(bins=50)
plt.show()
答案 1 :(得分:0)
好吧,我终于得到了与标题,标题等一起工作的东西。
import matplotlib.pyplot as plt
import pandas as pd
data = pd.read_csv('D1.csv', quoting=2)
data.hist(bins=50)
plt.xlim([0,115000])
plt.title("Data")
plt.xlabel("Value")
plt.ylabel("Frequency")
plt.show()
我的第一个问题是matplotlib是实际显示@Sauruxum所述的图形所必需的。另外,我需要设置动作
pd.read_csv('D1.csv', quoting=2)
数据,所以我可以用
绘制该动作的直方图data.hist
基本上,问题是没有找到标题行的名称。行动本身需要是.hist。感谢大家的帮助。