我已经看到一种使用update
的方法来使用update someFun each t from t
(主要是为了增加新列的副作用)。 使用这种技术是好事还是坏事?
一些实验:
t1:([]a:1 2);
t2:([]a:1 2;b:30 40);
update s:{(x`a)+x`b} each t2 from t1
似乎我们可以使用不同的表来执行此操作,所以我猜我们将有2倍的内存过度使用。
但是:
t:([]a:til 1000000;b:-1*til 1000000);
\ts:10 s0: update s:{(x`a)+x`b} each t from t;
4761 32778560
\ts:10 s1: update s:{(x`a)+x`b} each ([]a;b) from t;
4124 32778976
\ts:10 s2: update s:{x+y}'[a;b] from t;
1908 32778512
在所有情况下,几乎都能得到相同的结果。我想知道为什么内存消耗是相同的?
答案 0 :(得分:2)
在所有示例中,您都是在表的各个行上“遍历”,并且似乎内存消耗是逐步建立向量(多个内存块分配)而不是一次建立的结果。尽可能使用向量运算
q)n:5000000;t:([]a:til n;b:-1*til n)
q)
q)// each row
q)\ts update s:{(x`a)+x`b} each t from t;
1709 214218848
q)v:n#0
q)\ts {x}each v
361 214218256
q)
q)// vector op
q)\ts update s:sum a b from t;
18 67109760
q)\ts til n
5 67109040
答案 1 :(得分:1)
实际上,它已经使用了2倍的内存。
t的大小是-22!t
起的16 M
使用的内存为32 M