Python - 从文件到数据结构?

时间:2010-05-28 12:23:00

标签: python string

我有一个包含~100,000行的大文件。每行对应一个簇,每行中的每个条目都是一个引用i.d.对于另一个文件(在这种情况下为蛋白质结构),例如

1hgn 1dju 3nmj 8kfn
9opu 7gfb 
4bui

我需要在文件中读取每个行都是子列表的列表列表,从而保持集群的完整性,例如

nested_list = [['1hgn', '1dju', '3nmj', '8kfn'], ['9opu', '7gfb'], ['4bui']]

我当前的代码创建了一个嵌套列表,但每个列表中的条目都是单个字符串,而不是逗号分隔。因此,我不能轻易地将索引与索引拼接在一起。

非常感谢任何帮助。

谢谢, S: - )

2 个答案:

答案 0 :(得分:13)

超级简单:

with open('myfile', 'r') as f:
    data = [line.split() for line in f]

答案 1 :(得分:6)

您需要调查str.split()方法。

>>> '1hgn 1dju 3nmj 8kfn'.split()
['1hgn', '1dju', '3nmj', '8kfn']