拉伸列以匹配行中的匹配单元格

时间:2011-10-20 09:06:50

标签: python gnumeric

示例表:

  A  |  B  |  C  | ...
-----+-----+-----+----
  3  |  2  |  2  |    
  5  |  3  |  4  |    
  7  |  4  |  6  |    
  9  |  5  |  8  |    

我想以某种方式用Gnumeric来调节它并在列之间产生匹配的单元格:

  A  |  B  |  C  | ...
-----+-----+-----+----
  -  |  2  |  2  |    
  3  |  3  |  -  |    
  -  |  4  |  4  |    
  5  |  5  |  -  |    
  -  |  -  |  6  |    
  7  |  -  |  -  |    
  -  |  -  |  8  |    
  9  |  -  |  -  |    

真实的例子,如果使用字符串值而不是数字,但我更容易用数字来解释

如果这不是微不足道的,并且有人知道如何使用Python列表而不是Gnumeric中的表列,请发布Python解决方案。

1 个答案:

答案 0 :(得分:1)

在Python中很容易做到:

a = [3, 5, 7, 9]
b = [2, 3, 4, 5]
c = [2, 4, 6, 8]

a_ex, b_ex, c_ex = zip(*(
                        [elem if elem in col else None
                            for col in a, b, c] 
                                for elem in set(a).union(b, c)
                      ))

如果你不担心速度,似乎最直接。

我也注意到我对Joining multiple iteratorars by a key的答案适用:

def paditers(*args):
    iters = [iter(x) for x in args]

    this = [next(i) for i in iters]

    while True:
        try:
            key = min(i for i in this if i != None)
        except ValueError:
            break
        for i, val in enumerate(this):
            if val == key:
                yield val
                this[i] = next(iters[i], None)
            else:
                yield None

padded = list(paditers(a, b, c))
next_item = iter(padded).next
print zip(*((next_item(), next_item(), next_item()) 
         for _ in range(len(padded) // 3)))

如果您需要线性扩展性能,则可以进行调整。