我目前正在使用火炬在一些输入数据上实现随机shuffle(在行上,在这种情况下是第一个维度)。我是新来的火炬手,所以我有一些麻烦来弄清楚排列是如何运作的。
以下内容应该改组数据:
if argshuffle then
local perm = torch.randperm(sids:size(1)):long()
print("\n\n\nSize of X and y before")
print(X:view(-1, 1000, 128):size())
print(y:size())
print(sids:size())
print("\nPerm size is: ")
print(perm:size())
X = X:view(-1, 1000, 128)[{{perm},{},{}}]
y = y[{{perm},{}}]
print(sids[{{1}, {}}])
sids = sids[{{perm},{}}]
print(sids[{{1}, {}}])
print(X:size())
print(y:size())
print(sids:size())
os.exit(69)
end
打印出来
Size of X and y before
99
1000
128
[torch.LongStorage of size 3]
99
1
[torch.LongStorage of size 2]
99
1
[torch.LongStorage of size 2]
Perm size is:
99
[torch.LongStorage of size 1]
5
[torch.LongStorage of size 1x1]
5
[torch.LongStorage of size 1x1]
99
1000
128
[torch.LongStorage of size 3]
99
1
[torch.LongStorage of size 2]
99
1
[torch.LongStorage of size 2]
超出价值,我可以暗示该功能没有改变数据。如何正确地进行洗牌,lua / torch的常见解决方案是什么?
答案 0 :(得分:5)
我也面临类似的问题。在文档中,没有用于张量的随机播放功能(dataset loaders中有)。我使用torch.randperm
找到了解决该问题的方法。
>>> a=torch.rand(3,5)
>>> print(a)
tensor([[0.4896, 0.3708, 0.2183, 0.8157, 0.7861],
[0.0845, 0.7596, 0.5231, 0.4861, 0.9237],
[0.4496, 0.5980, 0.7473, 0.2005, 0.8990]])
>>> # Row shuffling
...
>>> a=a[torch.randperm(a.size()[0])]
>>> print(a)
tensor([[0.4496, 0.5980, 0.7473, 0.2005, 0.8990],
[0.0845, 0.7596, 0.5231, 0.4861, 0.9237],
[0.4896, 0.3708, 0.2183, 0.8157, 0.7861]])
>>> # column shuffling
...
>>> a=a[:,torch.randperm(a.size()[1])]
>>> print(a)
tensor([[0.2005, 0.7473, 0.5980, 0.8990, 0.4496],
[0.4861, 0.5231, 0.7596, 0.9237, 0.0845],
[0.8157, 0.2183, 0.3708, 0.7861, 0.4896]])
我希望它能回答问题!
答案 1 :(得分:1)
直接的解决方案是使用置换矩阵(线性代数中常见的那些)。由于您似乎对3d情况感兴趣,我们必须首先展平您的3d张量。所以,这是我提出的示例代码(即用型)
data=torch.floor(torch.rand(5,3,2)*100):float()
reordered_data=data:view(5,-1)
perm=torch.randperm(5);
perm_rep=torch.repeatTensor(perm,5,1):transpose(1,2)
indexes=torch.range(1,5);
indexes_rep=torch.repeatTensor(indexes,5,1)
permutation_matrix=indexes_rep:eq(perm_rep):float()
permuted=permutation_matrix*reordered_data
print("perm")
print(perm)
print("before permutation")
print(data)
print("after permutation")
print(permuted:view(5,3,2))
正如您将从一次执行中看到的那样,它根据data
中给出的行索引重新排序张量perm
。
答案 2 :(得分:0)
根据您的语法,我假设您使用的是lua而不是PyTorch。 torch.Tensor.index是您的功能,其工作原理如下:
x = torch.rand(4, 4)
p = torch.randperm(4)
print(x)
print(p)
print(x:index(1,p:long())
答案 3 :(得分:0)
dim = 0
idx = torch.randperm(t.shape[dim])
t_shuffled = t[idx]
如果你的张量是例如形状为 CxNxF(按功能按行按通道排列),然后您可以像这样沿第二个维度随机播放:
dim=1
idx = torch.randperm(t.shape[dim])
t_shuffled = t[:,idx]