Question

所以我基本上有一个非常长的字符串列表，以及一个包含一列字符串和一列数字的CSV文件。我需要遍历极长的字符串列表，并为每个字符串循环遍历CSV文件的行，检查CSV的第一列中的每个字符串，看它是否出现在我的字符串中，如果是，则添加在另一列中的数字。最小的一个例子是

import csv
sList = ['a cat', 'great wall', 'mediocre wall']
vals = []
with open('file.csv', 'r') as f:
    r = csv.reader(f)
    for w in sList:
        val = 0
        for row in r:
            if row[0] in w:
                val += 1
        vals.append(val)

我可能会使用此文件的CSV文件示例

a, 1
great, 2

当然csv.reader（f）创建一个我只能循环一次的迭代。我已经在其他地方看到了使用itertools的建议，但我发现的所有建议都涉及到涉及循环CSV文件少量的问题，通常只有两次。如果我多次尝试使用它来循环CSV，我不确定这对于内存消耗意味着什么，而且一般来说我只是想知道解决这个问题的最聪明的方法。

Answer 1

你需要＆＃34;重置＆＃34;文件迭代器：

import csv
sList = ['a cat', 'great wall', 'mediocre wall']
vals = []
with open('data.csv', 'r') as f:
    r = csv.reader(f)
    for w in sList:
        val = 0
        f.seek(0)  #<-- set the iterator to beginning of the input file
        for row in r:
            print(row)
            if row[0] in w:
                val += 1
        vals.append(val)

只能通过csv阅读器迭代一次

1 个答案: