如何理解多维张量?

时间:2020-09-29 01:14:50

标签: python pytorch tensor

我最近对张量有些困惑。假设我们有一个张量为(3,2,3,4)的张量,这意味着在第一维中有3组数字?还是仅仅意味着一维中只有3个数字?

然后是第二个问题,张量A的形状为(3,2),为什么torch.max(A,0)的输出返回一组包含2个最大值的最大值考虑到在第一维中有3个数字这一事实。

>>>a = torch.randn(3,2)
a tensor([[-1.1254, -0.1549],
        [-0.5308,  1.0427],
        [-0.1268,  1.0866]])
>>>torch.max(a,0)
torch.return_types.max(
values=tensor([-0.1268,  1.0866]),
indices=tensor([2, 2]))

我的意思是为什么它不返回3个最大值的列表?

然后是第三个问题,如果我们有两个形状为(3,3,10,2)和(2,4,10,1)的张量,是否可以将这两个张量在第三个维度上串联起来,考虑它们具有在那个尺寸上相同的尺寸?如果可行,背后的原因是什么?

如果您能帮助我理解这一点,我将不胜感激!

2 个答案:

答案 0 :(得分:1)

张量只是向量的高级维度。您应该先从向量开始。例如:4个元素矢量A = [1,2,3,4]。一个6个向量A在一起是B = [[1,2,3,4],[1,2,3,4],...,[1,2,3,4]]。这称为矩阵(2维),形状为6x4。现在,如果采用2个矩阵B,它将形成张量C,形状为(2,6,4)。将C扩展为3 C的列表,可以得到4维张量(3,2,6,4),依此类推。您可以拍这张照片以更好地说明。

illustration

对于割炬最大值torch.max(input, dim, keepdim=False, out=None),当您选择dim = 0时(减小尺寸即可表示沿0轴(又称第一个形状)找到最大值,它将沿该轴移动要找到对应于其余张量的最大数(根据张量,您只需要检入2个元素向量)即可。如果将其扩展为更高的尺寸(例如(3,4,5)形状),最大值为(4,5)。

对于最后一个问题,该张量不存在。因为当您查看图示时,您无法仅基于1个形状来连接2个不同大小的匹配张量。除了要连接的尺寸外,所有尺寸都必须保持相同的形状。

>>> b = np.random.randint(0,2,size=(2,3,2,3))
>>> a = np.random.randint(0,2,size=(2,3,1,3))
>>> np.concatenate([a,b],axis=2)

否则,唯一的方法就是将2个张量都展平,这样就只需要一个向量表示a和b。

答案 1 :(得分:0)

关于您的第一个答案:考虑图片。这样一来,可视化就会很简单。或者在您的示例中,堆叠了x = np.zeros((3,2,3,4))个3个3d张量,每个张量为(2,3,4)。

对于第二个问题,您至少应具有n-1个相同的维度才能连接到第n个维度。下面的图片将有助于您理解。

图片:https://ibb.co/q5WnMD5

您提到的第三个问题max(a,0),其中0代表轴,基本上是列,并且正在寻找每一列的最大值。