我在文本文件中有一个字符串。在文本文件中,年份应采用通用方式,我需要使用正则表达式来查找字符串数
data here is my text file
sword="list of people (2019) Revised 10"
count = data.count(sword)
print(count)
xtrct_data=sword.join(data.split(sword)[:count])
以上方法已奏效。当我以通用方式按需要进行这种编码时,它不起作用。我使用了正则表达式。
my code:
sword=re.search("list\sof\speople\s\([0-9]{4}\)\sRevised\s[0-9]+",data)
count=data.count(sword)
print(count)
我的预期输出应使用正则表达式“人员名单(2019)修订版10” ,我需要计数。进一步根据发生情况进行拆分。
预期输出: 如果“人员名单(2019)修订版10” ,该单词在文本文件中是10次,则应返回10
答案 0 :(得分:0)
检查:
import regex as re
data = 'list of people (2019) Revised 10 list of people (2018) Revised 9 list of people (2017) Revised 8'
regex = ur"list of people (.*?) Revised (.*?)"
print(len(re.findall(regex, data)))
即使修改后的单词的年份和数字发生变化,上述代码也将对出现的次数进行计数。
希望这会有所帮助!