我有一个大字符串,我想找到在这个字符串中匹配的所有输入序列。
所以,例如,我想在防守反弹中找到所有可能的比赛:
球员xy仅在比赛的第3节有10个<强防守篮板,这是2支球队之间的防守战,其中防守篮板率超过80%且此外,球员的平均篮板数是惊人的3.5
我想找到所有大胆的单词,然后提取它们。
我设法构建了一个执行提取的脚本,但它只适用于完全匹配。
我正在考虑使用difflib.SequenceMatcher
,但我被卡住了。
答案 0 :(得分:0)
你可以在python中使用正则表达式,你应该有一个goog模式来提取它们。
例如:
QNetworkRequest
import re
#Find [defence(s)][space][rebound(s)][space][any word]
re.findall('defensive[\w]* rebound[\w]* [\w]+', s)
#Find [rebound(s)][space][any word][space][any word][space][any word]
re.findall('rebound[\w]* [\w]+ [\w]+ [\w]+', s)
返回匹配列表
如果您的所有匹配都采用相同形式的粗体字,则可以使用以下内容提取它们:
findall