我有一个运行多次的模拟。每次生成一个数组并将其插入一个更大的数组中,跟踪所有数据。例如
record = []
for i in range(2):
r = random.random()
array = numpy.arange(20)*r
array.shape = (10,2)
record.append(array)
record = numpy.array(record)
产生:
[[[ 0. 0.88765927]
[ 1.77531855 2.66297782]
[ 3.55063709 4.43829637]
[ 5.32595564 6.21361492]
[ 7.10127419 7.98893346]
[ 8.87659274 9.76425201]
[ 10.65191128 11.53957056]
[ 12.42722983 13.3148891 ]
[ 14.20254838 15.09020765]
[ 15.97786693 16.8655262 ]]
[[ 0. 0.31394919]
[ 0.62789839 0.94184758]
[ 1.25579677 1.56974596]
[ 1.88369516 2.19764435]
[ 2.51159354 2.82554274]
[ 3.13949193 3.45344112]
[ 3.76739031 4.08133951]
[ 4.3952887 4.70923789]
[ 5.02318709 5.33713628]
[ 5.65108547 5.96503466]]]
由于每个array
代表我程序中的模拟。我想平均record
中包含的2个不同数组。
基本上我想要一个与array
具有相同尺寸的数组,但它将是所有单独运行的平均值。
我显然可以循环遍历数组但是在我的实际模拟中有很多数据,所以我认为它会非常昂贵的时间
示例输出(显然不会为零):
average = [[0.0, 0.0]
[0.0, 0.0]
[0.0, 0.0]
[0.0, 0.0]
[0.0, 0.0]
[0.0, 0.0]
[0.0, 0.0]
[0.0, 0.0]
[0.0, 0.0]
[0.0, 0.0]]
答案 0 :(得分:5)
上面示例中的record
数组是三维的,形状为:
>>> record.shape
(2, 10, 2)
第一个维度对应于实验的2次迭代。要对它们进行平均,您需要告诉np.average
在axis=0
>>> np.average(record, axis=0)
array([[ 0. , 0.45688836],
[ 0.91377672, 1.37066507],
[ 1.82755343, 2.28444179],
[ 2.74133015, 3.19821851],
[ 3.65510686, 4.11199522],
[ 4.56888358, 5.02577194],
[ 5.4826603 , 5.93954865],
[ 6.39643701, 6.85332537],
[ 7.31021373, 7.76710209],
[ 8.22399044, 8.6808788 ]])
如果您事先知道要运行多少个模拟,那么最好完全跳过列表内容并执行以下操作:
simulations, sim_rows, sim_cols = 1000000, 10, 2
record = np.empty((simulations, sim_rows, sim_cols))
for j in xrange(simulations) :
record[j] = np.random.rand(sim_rows, sim_cols)
>>> np.average(record, axis=0)
[[ 0.50021935 0.5000554 ]
[ 0.50019659 0.50009123]
[ 0.50008591 0.49973058]
[ 0.49995812 0.49973941]
[ 0.49998854 0.49989957]
[ 0.5002542 0.50027464]
[ 0.49993122 0.49989623]
[ 0.50024623 0.49981818]
[ 0.50005848 0.50016798]
[ 0.49984452 0.49999112]]
答案 1 :(得分:1)
基本上你可以使用
record.mean(axis=0)
我不确定您想要平均哪个轴,因为在您的示例中,两个轴的尺寸为2(您的阵列具有形状(2,10,2))。如果你想平均最后一个,只需使用
record.mean(axis=2)
答案 2 :(得分:0)
为什么你认为按时付出高昂代价?您仍然需要执行相同数量的添加。加法是联想的!
只是做:
averages = [average(subarray) for subarray in bigarray]