有时,我搜索的文档的引号数量不均匀。如果它们包含双引号,我可以很容易地找到所有这些事件,但单引号会让我失望。我如何捕获单引号而不捕获撇号,如you're
,Rob's
,Womens'
,didn't
等。
修改
例如,这个
"my friend likes apples.
将被此
捕获rgxDoubleQuotes = re.compile('\"')
for charseq in root.findall(".//span[@type='sentence']/extent/charseq[@START]"):
if rgxDoubleQuotes.findall(charseq.text):
if charseq.text.count("\"") % 2 != 0:
print charseq.text
但它不会捕获
'your dog just pissed.
我希望能够捕获第二个而不会捕获包含撇号的句子,如
the cat's name is same