假设我有一个包含许多行和列数据的.txt文件以及一个包含整数值的列表。如何在文本文件中加载与列表中的整数匹配的行号?
为了说明,我说有一个整数列表:
a = [1,3,5]
我如何只将文本文件中的行1,3和5读入数组?
numpy中的loadtxt例程让你们都跳过行并使用特定的列。但我似乎无法找到一种方法来做某事(忽略不正确的语法):
new_array = np.loadtxt('data.txt', userows=a, unpack='true')
谢谢。
答案 0 :(得分:5)
鉴于此文件:
1,2,3
4,5,6
7,8,9
10,11,12
13,14,15
16,17,18
19,20,21
您可以使用csv模块获取所需的np数组:
import csv
import numpy as np
desired=[1,3,5]
with open('/tmp/test.csv', 'r') as fin:
reader=csv.reader(fin)
result=[[int(s) for s in row] for i,row in enumerate(reader) if i in desired]
print(np.array(result))
打印:
[[ 4 5 6]
[10 11 12]
[16 17 18]]
答案 1 :(得分:3)
只是扩展我的评论
$ cat file.txt
line 0
line 1
line 2
line 3
line 4
line 5
line 6
line 7
line 8
line 9
line 10
的Python:
#!/usr/bin/env python
a = [1, 4, 8]
with open('file.txt') as fd:
for n, line in enumerate(fd):
if n in a:
print line.strip()
输出:
$ ./l.py
line 1
line 4
line 8
答案 2 :(得分:1)
除了需要将生成器对象而不是文件路径传递给函数之外,您可以坚持使用numpy的loadtxt
方法。
首先定义一个生成器,该生成器接受文件名和行索引,并仅产生指定索引处的那些行
def generate_specific_rows(filePath, userows=[]):
with open(filePath) as f:
for i, line in enumerate(f):
if i in userows:
yield line
现在您可以通过创建生成器对象并将其传递给loadtxt
方法
a = [1,3,5]
gen = generate_specific_rows('data.txt', userows=a)
new_array = np.loadtxt(gen, unpack='true')
答案 3 :(得分:0)
使用CSV module
和Files.xreadlines()
。
CSV module
:实现以CSV格式读取和写入表格数据的类
Files.xreadlines()
:在字典的键上返回一个迭代器。这是iterkeys()的快捷方式。 从版本2.3开始不推荐使用:改为使用for line in file
。
答案 4 :(得分:0)
我建议使用line.split ()
代替line.strip()
。
line.split ()
返回列表,可以使用numpy.array
命令轻松转换为np.asarray
。