Code golf:将多个排序列表组合到一个排序列表中

时间:2009-01-21 11:47:03

标签: algorithm language-agnostic sorting merge code-golf

实现一种算法,将任意数量的排序列表合并为一个排序列表。目标是用您喜欢的任何语言创建最小的工作程序。

例如:

input:  ((1, 4, 7), (2, 5, 8), (3, 6, 9))
output: (1, 2, 3, 4, 5, 6, 7, 8, 9)

input:  ((1, 10), (), (2, 5, 6, 7))
output: (1, 2, 5, 6, 7, 10)

注意:连接输入列表然后使用语言提供的排序功能的解决方案不符合高尔夫的精神,并且不会被接受:

sorted(sum(lists,[])) # cheating: out of bounds!

除了其他任何事情,你的算法(但不一定)快得多!

清楚地说明语言,任何缺点和字符数。在计数中只包含有意义的字符,但可以随意为代码添加空格以用于艺术/可读性目的。

为了保持整洁,建议改进评论或在适当时编辑答案,而不是为每个“修订版”创建新的答案。

编辑:如果我再次提交此问题,我会将“无语言提供排序”规则扩展为“不连接所有列表然后对结果进行排序”。连接然后排序的现有条目实际上非常有趣和紧凑,所以我不会回溯地引入它们破坏的规则,但是可以随意使用新提交的更严格的规范。


Combining two sorted lists in Python启发

26 个答案:

答案 0 :(得分:19)

OCaml,共42个字符:

let f=List.fold_left(List.merge compare)[]

我认为我应该得到42个额外的功劳?

答案 1 :(得分:8)

Python:113个字符

def m(c,l):
    try:
        c += [l[min((m[0], i) for i,m in enumerate(l) if m)[1]].pop(0)]
        return m(c,l)
    except:
        return c

# called as:
>>> m([], [[1,4], [2,6], [3,5]])
[1, 2, 3, 4, 5, 6]

编辑:在一些地方看到有关性能的讨论,我会提到我认为这是非常有效的实现,特别是随着列表的增长。我在10个排序随机数列表上运行了三种算法:

  • 我的解决方案(合并
  • sorted(sum(lists, []))内置
  • 以不同方式排序的
  • Deestan's solution重新实施

List merge performance

编辑 2:(JFS)

图中的标签:

    来自Python 2.6 stdlib 的
  • merge_26 - heapq.merge()
  • merge_alabaster - 上面的代码(上图中标为Merge
  • sort_builtin - L = sum(lists,[]); L.sort()
  • Deestan's solution是O(N ** 2)所以从比较中排除(所有其他解是O(N)(对于提供的输入))

输入数据为[f(N) for _ in range(10)],其中f()为:

max_ = 2**31-1
def f(N):
    L = random.sample(xrange(max_), n)
    L.sort()
    return L
f.__name__ = "sorted_random_%d" % max_

Performance data Nmax=2**16 注意:由于merge_alabaster()N > 100RuntimeError: "maximum recursion depth exceeded"无效。

要获取Python scripts that generated this figure,请输入:

$ git clone git://gist.github.com/51074.git

结论:对于相当大的列表,内置排序显示接近线性行为,并且它是最快的。

答案 2 :(得分:8)

Common Lisp已经为语言标准中的一般序列提供了merge函数,但它只适用于两个序列。对于按升序排序的多个数字列表,可以在以下函数中使用它(97个基本字符)。

(defun m (&rest s)
  (if (not (cdr s))
      (car s)
      (apply #'m
             (cons (merge 'list (car s) (cadr s) #'<)
                   (cddr s))))) 

编辑:一段时间后重新访问:这可以在一行中完成:

(defun multi-merge (&rest lists)
  (reduce (lambda (a b) (merge 'list a b #'<)) lists))

这有79个基本字符,有意义的名字,减少到一个字母,它出现在61:

(defun m(&rest l)(reduce(lambda(a b)(merge 'list a b #'<))l))

答案 3 :(得分:7)

Ruby:100个字符(1个重要空白,4个重要换行符)

def m(i)
  a=[]
  i.each{|s|s.each{|n|a.insert((a.index(a.select{|j|j>n}.last)||-1)+1,n)}}
  a.reverse
end

人类版本:

def sorted_join(numbers)
  sorted_numbers=[]

  numbers.each do |sub_numbers|
    sub_numbers.each do |number|
      bigger_than_me = sorted_numbers.select { |i| i > number }
      if bigger_than_me.last
        pos = sorted_numbers.index(bigger_than_me.last) + 1
      else
        pos = 0
      end

      sorted_numbers.insert(pos, number)
    end
  end

  sorted_numbers.reverse
end

这一切都可以由numbers.flatten.sort

取代

基准:

 a = [[1, 4, 7], [2, 4, 8], [3, 6, 9]]
 n = 50000
 Benchmark.bm do |b|
   b.report { n.times { m(a) } }
   b.report { n.times { a.flatten.sort } }
 end

产地:

      user     system      total        real
 2.940000   0.380000   3.320000 (  7.573263)
 0.380000   0.000000   0.380000 (  0.892291)

所以我的算法表现得非常糟糕,是的!

答案 4 :(得分:6)

重新提交

Python - 74个字符(计算空格和换行符)

def m(i):
 y=[];x=sum(i,[])
 while x:n=min(x);y+=[n];x.remove(n)
 return y
输入

i作为列表列表

用法:

>>> m([[1,5],[6,3]])
[1, 3, 5, 6]

答案 5 :(得分:5)

Haskell:127个字符(没有缩进和换行符)

m l|all null l=[]
   |True=x:(m$a++(xs:b))
 where
   n=filter(not.null)l
   (_,min)=minimum$zip(map head n)[0..]
   (a,((x:xs):b))=splitAt min n

它基本上概括了两个列表的合并。

答案 6 :(得分:4)

我会把它留在这里......

语言:C,字数:265

L[99][99];N;n[99];m[99];i;I;b=0;main(char t){while(scanf("%d%c",L[i]+I,&t)+1){++
I;if(t==10){n[i++]=I;I=0;}}if(I)n[i++] = I;N=i;while(b+1){b=-1;for(i=0;i<N;++i){
I=m[i];if(I-n[i])if(b<0||L[i][I]<L[b][m[b]])b=i;}if(b<0)break;printf("%d ",L[b][
m[b]]);++m[b];}puts("");}

接受这样的输入:

1 4 7
2 5 8
3 6 9
(EOF)

答案 7 :(得分:2)

C#

static void f(params int[][] b)
{
    var l = new List<int>();
    foreach(var a in b)l.AddRange(a);
    l.OrderBy(i=>i).ToList().ForEach(Console.WriteLine);
}
static void Main()
{
    f(new int[] { 1, 4, 7 },
      new int[] { 2, 5, 8 },
      new int[] { 3, 6, 9 });
}

答案 8 :(得分:2)

的Javascript

function merge(a) {
    var r=[], p;
    while(a.length>0) {
        for (var i=0,j=0; i<a.length && p!=a[j][0]; i++)
            if (a[i][0]<a[j][0])
                j = i;

        r.push(p = a[j].shift());

        if (!a[j].length)
            a.splice(j, 1);
    }
    return r;
}

测试:

var arr = [[1, 4, 7], [2, 5, 8], [3, 6, 9]]​;
alert(merge(arr));

答案 9 :(得分:2)

  

(所有其他解决方案都是O(N)(对于提供的输入))

如果我们让N是输出中元素的数量和k是输入列表的数量,那么你不能比O(N log k)更快 - 假设每个列表只是一个元素,并且你有比O(N log N)更快的基于比较的排序。

我看过的人看起来更像是O(N * k)。

你可以很容易地达到O(N log k)时间:只需将列表放入堆中。这是进行I / O效率排序的方法之一(您可以概括快速排序和堆/堆)。

[无代码,仅评论]

答案 10 :(得分:2)

虽然我没有耐心尝试这个,但是我的一位同事向我展示了使用0字符键可以做到这一点的方法 - Whie Space

答案 11 :(得分:2)

F#:116个字符

let p l=
    let f a b=List.filter(a b) in
    let rec s=function[]->[]|x::y->s(f(>)x y)@[x]@s(f(<=)x y) in
    [for a in l->>a]|>s

注意:此代码会导致F#抛出大量警告,但它有效:)

这是带有空格和有意义标识符的带注释版本(注意:上面的代码不使用#light语法,下面的代码可以):

let golf l=
    // filters my list with a specified filter operator
    // uses built-in F# function
    // ('a -> 'b -> bool) -> 'a -> ('b list -> 'b list)
    let filter a b = List.filter(a b)

    // quicksort algorithm
    // ('a list -> 'a list)
    let rec qsort =function
        | []->[]
        | x :: y -> qsort ( filter (>) x y) @ [x] @ qsort ( filter (<=) x y)

    // flattens list
    [for a in l ->> a ] |> qsort

答案 12 :(得分:1)

VB通常不是代码高尔夫的首选语言,但无论如何都是这样。

设置 -


        Dim m1 As List(Of Integer) = New List(Of Integer)
        Dim m2 As List(Of Integer) = New List(Of Integer)
        Dim m3 As List(Of Integer) = New List(Of Integer)
        Dim m4 As List(Of Integer) = New List(Of Integer)

        m1.Add(1)
        m1.Add(2)
        m1.Add(3)

        m2.Add(4)
        m2.Add(5)
        m2.Add(6)

        m3.Add(7)
        m3.Add(8)
        m3.Add(9)

        Dim m5 As List(Of List(Of Integer)) = New List(Of List(Of Integer))
        m5.Add(m1)
        m5.Add(m2)
        m5.Add(m3)

VB.NET尝试(无排序)

        While m5.Count > 0
            Dim idx As Integer = 0
            Dim min As Integer = Integer.MaxValue
            For k As Integer = 0 To m5.Count - 1
                If m5(k)(0) < min Then min = m5(k)(0) : idx = k
            Next
            m4.Add(min) : m5(idx).RemoveAt(0)
            If m5(idx).Count = 0 Then m5.RemoveAt(idx)
        End While

另一个VB.NET尝试(使用允许排序)


    Private Function Comp(ByVal l1 As List(Of Integer), ByVal l2 As List(Of Integer)) As Integer
        Return l1(0).CompareTo(l2(0))
    End Function
    .
    .
    .
    While m5.Count > 0
        m5.Sort(AddressOf Comp)
        m4.Add(m5(0)(0)) : m5(0).RemoveAt(0)
        If m5(0).Count = 0 Then m5.RemoveAt(0)
    End While

整个计划 -

        Dim rand As New Random
        Dim m1 As List(Of Integer) = New List(Of Integer)
        Dim m2 As List(Of Integer) = New List(Of Integer)
        Dim m3 As List(Of Integer) = New List(Of Integer)
        Dim m4 As List(Of Integer) = New List(Of Integer)
        Dim m5 As List(Of List(Of Integer)) = New List(Of List(Of Integer))
        m5.Add(m1)
        m5.Add(m2)
        m5.Add(m3)

        For Each d As List(Of Integer) In m5
            For i As Integer = 0 To 100000
                d.Add(rand.Next())
            Next
            d.Sort()
        Next

        Dim sw As New Stopwatch
        sw.Start()
        While m5.Count > 0
            Dim idx As Integer = 0
            Dim min As Integer = Integer.MaxValue
            For k As Integer = 0 To m5.Count - 1
                If m5(k)(0) < min Then min = m5(k)(0) : idx = k
            Next
            m4.Add(min) : m5(idx).RemoveAt(0)
            If m5(idx).Count = 0 Then m5.RemoveAt(idx)
        End While
        sw.Stop()

        'Dim sw As New Stopwatch
        'sw.Start()
        'While m5.Count > 0
        '    m5.Sort(AddressOf Comp)
        '    m4.Add(m5(0)(0)) : m5(0).RemoveAt(0)
        '    If m5(0).Count = 0 Then m5.RemoveAt(0)
        'End While
        'sw.Stop()

        Console.WriteLine(sw.Elapsed)
        Console.ReadLine()

答案 13 :(得分:1)

红宝石:

41个重要的字符,合并方法体中的3个重要的空白字符。

arrs是一个数组数组


  def merge_sort(arrs)
    o = Array.new
    arrs.each do |a|
      o = o | a
    end
    o.sort!
  end

用irb进行测试:


  arrs = [ [ 90, 4, -2 ], [ 5, 6, -100 ], [ 5, 7, 2 ] ]
  merge_sort(arrs)

返回:    [-100,-2,2,4,5,6,7,70]

编辑:使用提供的语言进行合并/排序,因为它可能由C代码支持并满足“更快”的要求。我会在没有以后考虑解决方案(这是周末,我正在度假)。

答案 14 :(得分:1)

Perl:22个字符,包括两个重要的空白字符。

sub a{sort map{@$_}@_}

这里只有内置。看到? ;)

这样打电话:

my @sorted = a([1, 2, 3], [5, 6, 89], [13, -1, 3]);
print "@sorted" # prints -1, 1, 1, 2, 3, 3, 5, 6, 89

老实说,否认语言特征(注意:不是图书馆......)似乎与此相反。在语言中实现的最短代码应包括构建/语言功能。当然,如果您导入模块,则应根据您的解决方案计算该代码。

编辑:删除$ _。

周围不必要的{}

答案 15 :(得分:1)

F#,32个字符

let f x=List.sort(List.concat x)

没有使用concat的内置函数(57个字符):

let f x=List.sort(Seq.toList(seq{for l in x do yield!l}))

答案 16 :(得分:0)

Haskell就像(158,但可以移除超过24个空格。):

mm = foldl1 m where
  m [] b = b
  m a [] = a
  m (a:as) (b:bs)
   | a <= b = a : m as (b:bs)
   | true   = b : m (a:as) bs

答案 17 :(得分:0)

Python,107个字符:

def f(l):  
 n=[]  
 for t in l:  
  for i in t: n+=[t]  
 s=[]  
 while n: s.+=[min(n)]; n.remove(min(n))  
 return s  

答案 18 :(得分:0)

VB.NET(2008)185个字符

接受列表(列表(字节))

Function s(i)

    s=New List(Of Byte)

    Dim m,c
    Dim N=Nothing

    Do
        m=N
        For Each l In i:
            If l.Count AndAlso(l(0)<m Or m=N)Then m=l(0):c=l

        Next

        If m<>N Then s.Add(m):c.Remove(m)       

    Loop Until m=N

End Function

答案 19 :(得分:0)

BASH约250个基本字符

BASH并不擅长列表操作,无论如何这都是有效的。

# This merges two lists together
m(){ 
    [[ -z $1 ]] && echo $2 && return; 
    [[ -z $2 ]] && echo $1 && return; 
    A=($1); B=($2); 
    if (( ${A[0]} > ${B[0]} ));then 
        echo -n ${B[0]}\ ;
        unset B[0];
    else 
        echo -n ${A[0]}\ ;
        unset A[0];
    fi;
    m "${A[*]}" "${B[*]}";
}
# This merges multiple lists
M(){
    A=$1;
    shift;
    for x in $@; do
        A=`m "$A" "$x"`
    done
    echo $A
}

$ M '1 4 7' '2 5 8' '3 6 9'
1 2 3 4 5 6 7 8 9

答案 20 :(得分:0)

对于Python,我认为你不会比@Sykora的回复here好得多。

已更改以处理您的输入:

import heapq
def m(i): 
    return list(heapq.merge(*i))

print m(((1, 4, 7), (2, 5, 8), (3, 6, 9)))

对于实际功能,59个字符,或缩小版本中的52:

import heapq
def m(i): return list(heapq.merge(*i))

这也有利于使用Python内置的经过测试的真实实现

修改:删除了分号(感谢@Douglas)。

答案 21 :(得分:0)

答案 22 :(得分:0)

GNU系统脚本(我猜这是作弊,但也很高兴知道)。

sort -m file1 file2 file3 ...

答案 23 :(得分:0)

即使它可能违反规则。这是一个很好的短 c ++ 条目:

13个字符

l1.merge(l2); // Removes the elements from the argument list, inserts 
              // them into the target list, and orders the new, combined 
              // set of elements in ascending order or in some other 
              // specified order.

答案 24 :(得分:-1)

VB

设置:

Sub Main()
    f(New Int32() {1, 4, 7}, _
      New Int32() {2, 5, 8}, _
      New Int32() {3, 6, 9})
End Sub

输出:

Sub f(ByVal ParamArray b As Int32()())
    Dim l = New List(Of Int32)
    For Each a In b
        l.AddRange(a)
    Next
    For Each a In l.OrderBy(Function(i) i)
        Console.WriteLine(a)
    Next
End Sub

答案 25 :(得分:-1)

Python,181个字符


from heapq import *
def m(l):
 r=[]
 h=[]
 for x in l:
  if x:
   heappush(h, (x[0], x[1:]))
 while h:
  e,f=heappop(h)
  r.append(e)
  if f:
   heappush(h, (f.pop(0),f))
 return r

这在O(NlgM)时间内运行,其中N是项目总数,M是列表数量。