如何在文本文件中使用正则表达式查找字符串计数?

时间:2019-05-18 06:44:28

标签: python python-3.x text-processing python-textprocessing

我在文本文件中有一个字符串。在文本文件中,年份应采用通用方式,我需要使用正则表达式来查找字符串数

data here is  my text file 

sword="list of people  (2019) Revised 10"
count = data.count(sword)
print(count)
xtrct_data=sword.join(data.split(sword)[:count])

以上方法已奏效。当我以通用方式按需要进行这种编码时,它不起作用。我使用了正则表达式。

my code:

sword=re.search("list\sof\speople\s\([0-9]{4}\)\sRevised\s[0-9]+",data)
count=data.count(sword)
print(count)

我的预期输出应使用正则表达式“人员名单(2019)修订版10” ,我需要计数。进一步根据发生情况进行拆分。

预期输出: 如果“人员名单(2019)修订版10” ,该单词在文本文件中是10次,则应返回10

1 个答案:

答案 0 :(得分:0)

检查:

import regex as re
data = 'list of people  (2019) Revised 10 list of people  (2018) Revised 9 list of people  (2017) Revised 8'
regex = ur"list of people (.*?) Revised (.*?)"
print(len(re.findall(regex, data)))

即使修改后的单词的年份和数字发生变化,上述代码也将对出现的次数进行计数。

希望这会有所帮助!