我做了一些基准测试:
require 'benchmark'
words = File.open('/usr/share/dict/words', 'r') do |file|
file.each_line.take(1_000_000).map(&:chomp)
end
Benchmark.bmbm(20) do |x|
GC.start
x.report(:map) do
words.map do |word|
word.size if word.size > 5
end.compact
end
GC.start
x.report(:each_with_object) do
words.each_with_object([]) do |word, long_sizes|
long_sizes << word.size if word.size > 5
end
end
end
输出(ruby 2.3.0):
Rehearsal --------------------------------------------------------
map 0.020000 0.000000 0.020000 ( 0.016906)
each_with_object 0.020000 0.000000 0.020000 ( 0.024695)
----------------------------------------------- total: 0.040000sec
user system total real
map 0.010000 0.000000 0.010000 ( 0.015004)
each_with_object 0.020000 0.000000 0.020000 ( 0.024183)
我无法理解它,因为我认为each_with_object
应该更快:它只需要1个循环和1个新对象来创建一个新数组,而不是2个循环和2个新对象,以防我们合并{{1 }和map
。
有什么想法吗?
答案 0 :(得分:10)
string
需要重新分配内存。请参阅the implementation,尤其是此行
Array#<<
虽然VALUE target_ary = ary_ensure_room_for_push(ary, 1);
不必重新分配内存,因为它已经知道结果数组的大小。请参阅the implementation,尤其是
Array#map
,它分配与原始数组相同的内存大小。