从csv / 2d数组中提取一系列元素

时间:2014-05-30 01:49:56

标签: python arrays csv

我想从一系列元素中提取元素是csv文件中的特定列。

我已将问题简化为:

data = [['a',1,'A',100],['b',2,'B',200],['c',3,'C',300],['d',4,'D',400]]

print(data[0:2][:],'\nROWS 0&1')
print(data[:][0:2],'\nCOLS 1&1')

我认为这意味着

  • '显示第0行和第1行的所有列
  • '显示第0列和第1列的所有行

但是输出总是只显示行0和1,而不是列,

[['a', 1, 'A', 100], ['b', 2, 'B', 200]] 
ROWS 0&1
[['a', 1, 'A', 100], ['b', 2, 'B', 200]] 
COLS 1&1

当我想看到这个时:

['a', 1, 'A', 100,'b', 2, 'B', 200]  # ... i.e. ROWS 0 and 1
['a','b','c','d',1,2,3,4]

有一个很好的方法吗?

1 个答案:

答案 0 :(得分:2)

这里的问题是data[:]只是a copy of data

>>> data
[['a', 1, 'A', 100], ['b', 2, 'B', 200], ['c', 3, 'C', 300], ['d', 4, 'D', 400]]
>>> data[:]
[['a', 1, 'A', 100], ['b', 2, 'B', 200], ['c', 3, 'C', 300], ['d', 4, 'D', 400]]

...所以你的切片尝试都会给你与data[0:2]相同的结果。

你可以通过列表理解获得第0列和第1列:

>>> [x[0:2] for x in data] 
[['a', 1], ['b', 2], ['c', 3], ['d', 4]]

...可以使用zip()重新排列为您想要的顺序:

>>> list(zip(*(x[0:2] for x in data)))
[('a', 'b', 'c', 'd'), (1, 2, 3, 4)]

要获取单个列表而不是2个元组的列表,请使用itertools.chain.from_iterable()

>>> from itertools import chain
>>> list(chain.from_iterable(zip(*(x[0:2] for x in data))))
['a', 'b', 'c', 'd', 1, 2, 3, 4]

...也可用于折叠data[0:2]

>>> list(chain.from_iterable(data[0:2]))
['a', 1, 'A', 100, 'b', 2, 'B', 200]