从OpenDocument文本圣经中提取希伯来语文本

时间:2016-02-26 16:53:45

标签: python-2.7 odf

我正在尝试使用以下代码从OpenDocument Text(odt)格式的圣经中提取希伯来文本:

from odf import text, teletype
from odf.opendocument import load

textdoc = load("Heb-OT.odt")
texts = textdoc.getElementsByType(text.P)
alltext=teletype.extractText(texts[0])
print alltext

这不会打印任何内容 我不知道出了什么问题。 该文件很长(1000页),但我需要全部搜索。

0 个答案:

没有答案