所以我正在阅读来自不同组织的多个文件。每个文件都有文件编号和组织。我试图通读文件列表,只找到组织'OCE'
中的那些文件,并忽略其他文件。我的目标是计算总共'OCE'
个文件的数量,并打印出他们的文件编号。
我的问题是如何编码我只想选择'OCE'
中的文件并忽略其他文件的部分?甚至不确定使用哪种语句。任何建议都非常感谢。
for filepath in matches[:20]:
with open (filepath,'rt') as mytext:
mytext=mytext.read()
# Find all files from 'OCE'.
grabOrg=re.findall(r'NSF\s+Org\s+\:\s+(OCE)',mytext)
if len(grabOrg) != 0:
OCEOrg=grabOrg[0] **# Here is my question.**
from collections import Counter
countOrg=Counter(OCEOrg)
print str(OCEOrg) + '|' + countOrg