如何使用Python将文本文件读入列表或数组

时间:2013-02-03 19:19:51

标签: python arrays list text

我正在尝试将文本文件的行读入python中的列表或数组。我只需要能够在创建后单独访问列表或数组中的任何项目。

文本文件的格式如下:

0,0,200,0,53,1,0,255,...,0.

...位于上方,实际文本文件中有数百或数千个项目。

我正在使用以下代码尝试将文件读入列表:

text_file = open("filename.dat", "r")
lines = text_file.readlines()
print lines
print len(lines)
text_file.close()

我得到的输出是:

['0,0,200,0,53,1,0,255,...,0.']
1

显然,它正在将整个文件读入只有一个项目的列表,而不是单个项目的列表。我做错了什么?

7 个答案:

答案 0 :(得分:105)

您必须使用split()

将字符串拆分为值列表

所以,

lines = text_file.read().split(',')

答案 1 :(得分:97)

python的file.readLines()方法返回文件中的行列表:

f = open('file_name.ext', 'r')
x = f.readlines()
f.close()

现在你应该能够遍历x行数组。

如果您想使用该文件而不必记得以后关闭它,请执行以下操作:

with open('file_name.ext', 'r') as f:
    x = f.readlines()

答案 2 :(得分:34)

你也可以使用像

这样的numpy loadtxt
from numpy import loadtxt
lines = loadtxt("filename.dat", comments="#", delimiter=",", unpack=False)

答案 3 :(得分:14)

所以你想创建一个列表列表......我们需要从一个空列表开始

list_of_lists = []

接下来,我们逐行阅读文件内容

with open('data') as f:
    for line in f:
        inner_list = [elt.strip() for elt in line.split(',')]
        # in alternative, if you need to use the file content as numbers
        # inner_list = [int(elt.strip()) for elt in line.split(',')]
        list_of_lists.append(inner_list)

一个常见的用例是柱状数据,但我们的存储单元是 我们已逐一阅读的文件行,因此您可能希望转置 你的清单清单。这可以通过以下习语来完成

by_cols = zip(*list_of_lists)

另一个常见用途是为每列提供一个名称

col_names = ('apples sold', 'pears sold', 'apples revenue', 'pears revenue')
by_names = {}
for i, col_name in enumerate(col_names):
    by_names[col_name] = by_cols[i]

以便您可以对同类数据项进行操作

 mean_apple_prices = [money/fruits for money, fruits in
                     zip(by_names['apples revenue'], by_names['apples_sold'])]

我写的大部分内容都可以使用标准库中的csv模块加速。另一个第三方模块是pandas,它允许您自动化典型数据分析的大多数方面(但具有许多依赖性)。


更新在Python 2中zip(*list_of_lists)返回一个不同的(转置的)列表列表,在Python 3中情况发生了变化,zip(*list_of_lists)返回一个zip对象不可订阅。

如果您需要索引访问权限,则可以使用

by_cols = list(zip(*list_of_lists))

它为您提供了两个版本的Python中的列表列表。

另一方面,如果你不需要索引访问,你想要的只是建立一个由列名索引的字典,一个zip对象就好......

file = open('some_data.csv')
names = get_names(next(file))
columns = zip(*((x.strip() for x in line.split(',')) for line in file)))
d = {}
for name, column in zip(names, columns): d[name] = column

答案 4 :(得分:3)

这个问题是询问如何将文件中逗号分隔的值内容读入可迭代列表:

0,0,200,0,53,1,0,255,...,0.

最简单的方法是使用csv模块,如下所示:

import csv
with open('filename.dat', newline='') as csvfile:
    spamreader = csv.reader(csvfile, delimiter=',')

现在,您可以像这样轻松迭代spamreader

for row in spamreader:
    print(', '.join(row))

有关更多示例,请参阅documentation

答案 5 :(得分:0)

with open('D:\python\positive.txt', 'r') as myfile: data=myfile.read().replace('\n', '')

答案 6 :(得分:0)

如果您的文件包含数值,那么numpy的loadtxt方法似乎是最好的方法。您可以读取数组,如下所示:

import numpy as np

filename = '../data/NLPR_MCT/db3/cam1.dat'
x = np.loadtxt(filename, delimiter=',')
print (x)

您可以在x和file.index中将值索引为数组。readlines()不方便,因为它在每行中插入“ \ n”,并且索引可能会出错。