在另一个question中,结果很好,但还不够好。箱子是字符串,频率图不是真实的。就像每个项目都是一个字符串,但我希望它们是int。我怎么能这样做?
我想知道的是有多大,每个动作都有数千行的“日期”,正常日期的正常参赛作品数量。这是我的代码:
df["dayOfYear"] = df["date"].dt.dayofyear
plt.hist(df.groupby(df["dayOfYear"]).count())
它给了我答案,但是bin是字符串,而不是int,所以X轴是字符串的集合,避免让我得到一个很好的高斯分布。
我尝试了int()它,但它对熊猫不起作用。
有任何帮助吗?谢谢! 米格尔。
答案 0 :(得分:0)
我刚发现它。就像改变一样简单:
plt.hist(df.groupby(df["dayOfYear"]).count())
的
plt.hist(df["dayOfYear"].groupby(df["dayOfYear"]).count())
我应该删除这个问题吗?也许这是一个非常愚蠢的问题。抱歉,我是新来的。