我有一个包含10个Pandas数据帧的字典,我想使用Numpy堆叠它们。我可以这样做的一种方法是输入:
tensor = numpy.stack((dict[0],dict[1],...,dict[9]),axis=0)
但是,随着词典中项目数量的增加,这变得非常烦人。有没有一种方法可以一次传递字典中的所有项目,而不是如上所述手动键入每个元素?
以下使用拆包的尝试给了我一个'TypeError:stack()关键字必须为字符串'错误:
tensor = numpy.stack(**dict,axis=0)
什么是解决此问题的有效且Python方式?
答案 0 :(得分:2)
**dict
用于接受关键字参数的函数。它将字典解压缩为一组key=value
自变量。例如:
像您一样的字典,使用整数作为键:
In [157]: dd = {0:np.arange(3),1:np.arange(10,13)}
一个功能:
In [158]: def foo(**kwargs):
...: print(kwargs)
...:
您的错误:
In [159]: foo(**dd)
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-159-965b46c2342b> in <module>
----> 1 foo(**dd)
TypeError: foo() keywords must be strings
它不想做:foo(0=..., 1=...)
。
如果我使用有效变量名称的字符串参数定义字典:
In [160]: dd = {'key0':np.arange(3),'key1':np.arange(10,13)}
In [161]: foo(**dd)
{'key0': array([0, 1, 2]), 'key1': array([10, 11, 12])}
因此可以解释当前的错误。
但是,stack
仍然无法使用,它具有签名:
np.stack(arrays, axis=0, out=None)
我可以使用字典来提供关键字参数,而不是arrays
参数:
In [165]: pdict = {'axis':0, 'out':None}
In [166]: alist = [np.arange(3), np.arange(10,13)]
In [167]: np.stack(alist, **pdict)
Out[167]:
array([[ 0, 1, 2],
[10, 11, 12]])
使用数字键返回字典。我可以使用.values
从字典中提取数组,并将其作为列表传递给stack
:
In [171]: dd = {0:np.arange(3),1:np.arange(10,13)}
In [172]: list(dd.values())
Out[172]: [array([0, 1, 2]), array([10, 11, 12])]
In [173]: np.stack(list(dd.values()))
Out[173]:
array([[ 0, 1, 2],
[10, 11, 12]])
答案 1 :(得分:0)
收到TypeError的原因是因为您的字典键不是字符串。
您可以尝试使用np.stack()
将值传递到dict.values()
。
tensor = np.stack(dict.values(), axis = 0)