如何在ODT(OpenDocumentText)文件中提取表格,文本和图片,以便在Ubuntu上使用Python将它们输出到另一个ODT文件?
答案 0 :(得分:1)
OOoPy似乎很合适。我从来没有使用它,但它带有文档和代码示例,它可以读写ODT文件。
答案 1 :(得分:0)
一种简单的方法是将foo.odt
重命名为foo.zip
,然后将其解压缩。解压缩的目录包含许多文件,包括图片。
但是我认为最好将其类型更改为docx
,然后在docx
上执行此过程(将其解压缩)。因为它提取了更好名称的图像(image1,image2,...)。