我打算在linux上使用apache poi或python xlrd来读取linux上程序中的电子表格。我偏向于python xlrd,但apache poi对我来说似乎是一个更完整的项目(可能是因为它得到了apache基础的支持)。什么是更好的选择(我偏向python但仍然......)?我希望能够阅读大多数excel版本并阅读宏。
答案 0 :(得分:2)
根据您的需求的复杂程度,您可能只使用Apache Tika CLI。 Tika处理与POI(和其他库)的交谈,并将返回该文档的XHTML或纯文本版本。如果你只想要一个简单的linux命令,那可能就足够了。
否则,它可能取决于您的Java技能是什么样的。 POI应该做你需要的一切,但是你需要编写一些代码来抓住你感兴趣的位。请查看quick guide以帮助您入门。
(我不知道xlrd,抱歉)
答案 1 :(得分:0)
可能充分利用两个世界的一个选择是通过Jython利用Apache POI(使用java interop的python语法)。
Here是一个陈旧的jython示例...我相信这需要使用更新版本的POI进行更改。