现在的问题是我正在处理foregin(Brazillian葡萄牙语)文本。 得到并解决了" UnicodeDecodeError"将此添加到BrTH的代码
是致命的错误 import codecs
#next lines are inside getPDFContent function
content += pdf.getPage(i).extractText() + "\n"
content = content.decode("utf-8")
现在的问题是"打印getPDFContent(f)"我只尝试使用任何PDF返回两个空白行。显然,关键字搜索只会返回" False"。你能帮我一次吗?