如何从文件列表中选择一些文件?

时间:2014-03-16 20:41:43

标签: python-2.7 data-extraction

所以我正在阅读来自不同组织的多个文件。每个文件都有文件编号和组织。我试图通读文件列表,只找到组织'OCE'中的那些文件,并忽略其他文件。我的目标是计算总共'OCE'个文件的数量,并打印出他们的文件编号。

我的问题是如何编码我只想选择'OCE'中的文件并忽略其他文件的部分?甚至不确定使用哪种语句。任何建议都非常感谢。

for filepath in matches[:20]:
    with open (filepath,'rt') as mytext:
        mytext=mytext.read()


        # Find all files from 'OCE'.
        grabOrg=re.findall(r'NSF\s+Org\s+\:\s+(OCE)',mytext)
        if len(grabOrg) != 0:
            OCEOrg=grabOrg[0]   **# Here is my question.**

            from collections import Counter
            countOrg=Counter(OCEOrg)
            print str(OCEOrg) + '|' + countOrg

0 个答案:

没有答案