使用groupby方法时出错:
data = pd.Series(np.random.randn(100),index=pd.date_range('01/01/2001',periods=100))
keys = lambda x: [x.year,x.month]
data.groupby(keys).mean()
但它有一个错误:TypeError:unhashable type:'list'。 我想按年和月分组,然后计算方法,为什么有错?
答案 0 :(得分:15)
tuple
对象不能用作密钥,因为它不可清除。您可以改为使用>>> {[1, 2]: 3}
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unhashable type: 'list'
>>> {(1, 2): 3}
{(1, 2): 3}
对象:
data = pd.Series(np.random.randn(100), index=pd.date_range('01/01/2001', periods=100))
keys = lambda x: (x.year,x.month) # <----
data.groupby(keys).mean()
flatMap
答案 1 :(得分:3)
在将列表用作groupby键之前,先将列表转换为str。
data.groupby(lambda x: str([x.year,x.month])).mean()
Out[587]:
[2001, 1] -0.026388
[2001, 2] -0.076484
[2001, 3] 0.155884
[2001, 4] 0.046513
dtype: float64