我有一个简单但很大的数据文件。它是神经网络模拟的输出。第一列是时间步,1..200。第二个是目标字(对于当前模拟,1..212)。然后有212列,每个单词一列。也就是说,在给定特定目标(输入)字的特定时间步长处,每行具有每个字节点的激活值。
我需要进行简单的操作,例如将每个激活转换为响应强度(exp(常数x激活)),然后将每个响应强度除以响应强度的行总和。在R中执行此操作非常慢(20分钟),并且使用perl中的常规循环执行此操作更快但仍然很慢(7分钟),因为稍后的模拟将涉及数千个单词。
似乎PDL应该能够更快地做到这一点。我一直在阅读PDL文档,但我真的不知道如何做第二步。第一个似乎就像选择激活列并将它们放入$ act然后:
一样简单$ rp = exp($ act * $ k);
但我无法弄清楚如何将每个值除以行总和。任何意见,将不胜感激。
谢谢!
答案 0 :(得分:0)
看起来你需要制作一个矩阵的副本,然后使用第一个来读取,第二个也要写。 注意使用$ c ++而不是for $ loop(){可能更有效! }
$x = sequence(3,3)*2+1;
[ 1 3 5]
[ 7 9 11]
[13 15 17]
$y .= $x; # if you use = here it will change both x and y
for $c(0..2) { for $d(0..2) { $y($c,$d) .= $y($c,$d) / sum($x(,$d)) }}
p $y;
[0.11111111 0.33333333 0.55555556]
[0.25925926 0.33333333 0.40740741]
[0.28888889 0.33333333 0.37777778]