我想要想象这些数据:
数据来源:http://pastebin.com/vx9xLtdm
我无法每天对数据进行分组。
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
df = pd.read_csv('sample.csv')
我试过了两个
x = df.groupby(lambda x: x.created_date()))
x = df.set_index('date')
用于可视化
df.hist(color='k', alpha=0.5, bins=50)
plt.show()
答案 0 :(得分:5)
以下是使用pandas.Series的hist方法基于数据的示例
(请注意,您的数据是一个系列,而squeeze=True
中的read_csv
会返回一个系列
在这种情况下):
In [16]: s = pd.read_csv('http://pastebin.com/raw.php?i=vx9xLtdm',
....: parse_dates=True, index_col=0, squeeze=True,
....: na_values=-9999)
In [17]: bins = np.linspace(s.min(), s.max(), num=50)
In [18]: axes = s.hist(by=s.index.date, bins=bins, sharex=True, sharey=True)
In [19]: plt.gcf().autofmt_xdate()
In [20]: plt.draw()