如何从Python中的.txt文件加载特定行?

时间:2013-09-24 20:51:42

标签: python numpy

假设我有一个包含许多行和列数据的.txt文件以及一个包含整数值的列表。如何在文本文件中加载与列表中的整数匹配的行号?

为了说明,我说有一个整数列表:

a = [1,3,5]

我如何只将文本文件中的行1,3和5读入数组?

numpy中的loadtxt例程让你们都跳过行并使用特定的列。但我似乎无法找到一种方法来做某事(忽略不正确的语法):

new_array = np.loadtxt('data.txt', userows=a, unpack='true')

谢谢。

5 个答案:

答案 0 :(得分:5)

鉴于此文件:

1,2,3
4,5,6
7,8,9
10,11,12
13,14,15
16,17,18
19,20,21

您可以使用csv模块获取所需的np数组:

import csv
import numpy as np

desired=[1,3,5]
with open('/tmp/test.csv', 'r') as fin:
    reader=csv.reader(fin)
    result=[[int(s) for s in row] for i,row in enumerate(reader) if i in desired]

print(np.array(result))   

打印:

[[ 4  5  6]
 [10 11 12]
 [16 17 18]]

答案 1 :(得分:3)

只是扩展我的评论

$ cat file.txt
line 0
line 1
line 2
line 3
line 4
line 5
line 6
line 7
line 8
line 9
line 10

的Python:

#!/usr/bin/env python

a = [1, 4, 8]

with open('file.txt') as fd:
    for n, line in enumerate(fd):
        if n in a:
            print line.strip()

输出:

$ ./l.py 
line 1
line 4
line 8

答案 2 :(得分:1)

除了需要将生成器对象而不是文件路径传递给函数之外,您可以坚持使用numpy的loadtxt方法。

首先定义一个生成器,该生成器接受文件名和行索引,并仅产生指定索引处的那些行

def generate_specific_rows(filePath, userows=[]):
    with open(filePath) as f:
        for i, line in enumerate(f):
            if i in userows:
                yield line

现在您可以通过创建生成器对象并将其传递给loadtxt方法

a = [1,3,5]
gen = generate_specific_rows('data.txt', userows=a)
new_array = np.loadtxt(gen, unpack='true')

答案 3 :(得分:0)

使用CSV moduleFiles.xreadlines()

  
      
  • CSV module:实现以CSV格式读取和写入表格数据的类

  •   
  • Files.xreadlines():在字典的键上返回一个迭代器。这是iterkeys()的快捷方式。   从版本2.3开始不推荐使用:改为使用for line in file

  •   

答案 4 :(得分:0)

我建议使用line.split ()代替line.strip()line.split ()返回列表,可以使用numpy.array命令轻松转换为np.asarray