如何使用Python以ODT(OpenDocumentText)格式提取表格,文本和图片?

时间:2013-03-21 03:44:56

标签: python ubuntu odt

如何在ODT(OpenDocumentText)文件中提取表格,文本和图片,以便在Ubuntu上使用Python将它们输出到另一个ODT文件?

2 个答案:

答案 0 :(得分:1)

OOoPy似乎很合适。我从来没有使用它,但它带有文档和代码示例,它可以读写ODT文件。

答案 1 :(得分:0)

一种简单的方法是将foo.odt重命名为foo.zip,然后将其解压缩。解压缩的目录包含许多文件,包括图片。

但是我认为最好将其类型更改为docx,然后在docx上执行此过程(将其解压缩)。因为它提取了更好名称的图像(image1,image2,...)。