Question

我有一个列表['dog', 'cat', 'snake', 'lizard']。我想使用此列表从文本文件中提取行。我的文本文件是以每行末尾的换行符分隔的制表符。每行有4列，第一列是我列表中的一个名称。前五行看起来像：

dog     data1     data2    data3
dog     data1     data2    data3
cat     data1     data2    data3
snake   data1     data2    data3
lizard  data1     data2    data3

很多行

。

我想为列表中的每个项目创建一个文本文件。在每个新文件中，我想要原始文件中的每一行，其中第一列与列表/新文件中的名称匹配。这是我写的代码：

filename = "data.txt"
f = open(filename, 'r')

#my list is named Species
for names in Species:
    with open(str(names) + ".txt", 'w') as g:       
        for line in f:
            row = line.split()
            if names == row[0]:
                g.write(row)

我能够创建我想要写入的文本文件，但没有任何内容写入文件。我收到没有错误消息。最后，我希望能够只为我有兴趣放入新文本文件的每一行提取一些数据列。

Answer 1

尝试将列表直接写入文件（在Python中不合法）时，您应该收到错误：

Python 2.7：

Python 2.7.10 (default, Sep 13 2015, 20:30:50) 
[GCC 5.2.1 20150911] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> with open("test", "w") as f:
...   f.write([1,2,3,4])
... 
Traceback (most recent call last):
  File "<stdin>", line 2, in <module>
TypeError: expected a character buffer object
>>>

write未被调用，可能是因为没有匹配Species[0]的行。在for上再次调用顶级Species[1]循环时，f已经位于文件末尾，并且不再提供任何行。 seek到循环开始时文件的开头：

for name in Species:
    f.seek(0)
    with open(str(names) + ".txt", "w") as g:
        for line in f:
            if line.startswith(name):
                g.write(line)

或者（这就是我要做的）您可以扫描f一次，并在处理时将每一行分配给适当的动物：

records = {}
for line in f:
    animal = line.split()[0]
    if not records.get(animal):
        records[animal] = []
    records[animal].append(line)

for animal in records.keys():
    with open("{}.txt".format(animal), "w") as f:
        for line in records[animal]:
            f.write(line)

Answer 2

这是更新后的代码！

Species = ['dog', 'cat', 'snake', 'lizard']
filename = "data.txt"
for names in Species:
    with open(str(names) + ".txt", 'w') as g:
        f = open(filename, 'r')
        for line in f:
            row = line.split()
            if names == row[0]:
                g.write(str(row))
        f.close()

您需要在g.write（）中添加str（行），因为您无法编写数组文本文件。
重新开启＆＃34; data.txt＆＃34;似乎解决了你的问题与不写入的文件（不太确定为什么虽然编辑：哦，这就是为什么:)）

python：当第一列匹配列表中的字符串时从文本文件中拉行

2 个答案: