获取带有向量的数据帧的点积,并在Pandas中返回数据帧

时间:2013-04-02 00:00:07

标签: python pandas dataframe dot-product

我无法找到方法dot() in the official documentation上的条目。然而,方法就在那里,我可以使用它。这是为什么?

关于这个主题,有没有办法计算数据框中每一行与另一个向量的逐元素乘法? (并获得dataframe后退?),即类似于dot(),但不是计算点积,而是计算元素乘积。

3 个答案:

答案 0 :(得分:9)

mul基本上是外部产品,而dot是内部产品。让我扩展接受的答案:

In [13]: df = pd.DataFrame({'A': [1., 1., 1., 2., 2., 2.], 'B': np.arange(1., 7.)})

In [14]: v1 = np.array([2,2,2,3,3,3])

In [15]: v2 = np.array([2,3])

In [16]: df.shape
Out[16]: (6, 2)

In [17]: v1.shape
Out[17]: (6,)

In [18]: v2.shape
Out[18]: (2,)

In [24]: df.mul(v2)
Out[24]: 
   A   B
0  2   3
1  2   6
2  2   9
3  4  12
4  4  15
5  4  18

In [26]: df.dot(v2)
Out[26]: 
0     5
1     8
2    11
3    16
4    19
5    22
dtype: float64

所以:

df.mul采用形状矩阵(6,2)和向量(6,1)并返回矩阵形状(6,2)

虽然:

df.dot采用形状矩阵(6,2)和向量(2,1)并返回(6,1)。

这些操作不同,它们分别是外部和内部产品。

答案 1 :(得分:8)

以下是如何将DataFrame乘以向量的示例:

In [60]: df = pd.DataFrame({'A': [1., 1., 1., 2., 2., 2.], 'B': np.arange(1., 7.)})

In [61]: vector = np.array([2,2,2,3,3,3])

In [62]: df.mul(vector, axis=0)
Out[62]: 
   A   B
0  2   2
1  2   4
2  2   6
3  6  12
4  6  15
5  6  18

答案 2 :(得分:1)

很难准确地说出来。

通常,一种方法存在并且没有记录,因为它被供应商视为内部方法,并且可能会发生变化。

当然,这可能是整理文档的人们的简单疏忽。

关于你的第二个问题;我真的不知道 - 但是为它制作一个新的S / O问题可能会更好。 只是扫描API,您可以使用DataFrame的.applymap(函数)功能吗?