我正在使用SAX Parser。我正在尝试发送'内容'我使用以下代码检索:
检查startElement和endElement后,我有以下代码:
def characters(self, content):
text = format.formatter(content)
这个format.formatter应该读取我发送的内容'内容'任何处理,如删除垃圾字符等,并返回它。我通过使用string.replace函数来做到这一点:
remArticles = {' ! ':'',' $':''}
for line in content: 对于我在remArticles: line = line.replace(i,remArticles [i]) #FormattedFileForIndexing.write(线) 返回行
然而,输出没有达到预期效果。
如果有人可以提供帮助,那就太好了。
来源会有点像:
"喔!这是很多和1000的$$$$"
期待:哦那很多1000s
我试过了:
def characters(content):
remArticles = {'!': '', '$': ''} # remove spaces from " ! "
for i in remArticles:
content = content.replace(i, remArticles[i])
return content
但它没有帮助。它不会被取代。我觉得它早一点工作,但看起来它今天不起作用: Pass Content To Function of Another Module in Python