对于NLP中的一个项目,我正在尝试准备用于命名实体识别的数据。我有一堆带有.doc扩展名的Word文档,第一步是要将其转换为.docx格式。 我被告知要在Linux中执行此操作,因此我在Windows PC的virtualbox中安装了Ubuntu 18.4。我的老师建议我使用“ unoconv”,所以我对此进行了研究,安装了它,但是在使它起作用时我遇到了很大的问题。 我没有在Linux上工作的经验,并且在Python编程,数据科学等方面也有很少的经验。
我已经学习了如何在Linux终端中工作,并使用以下link安装了unoconv:
sudo apt-get install unoconv
但是当我想显示可以通过unoconv使用哪些命令时(只是检查unoconv是否起作用):
unoconv --show
我在linux终端中收到此错误:
unoconv: Cannot find a suitable pyuno library and python library
combination in /usr/lib/libreoffice/
ERROR: No module named uno
unoconv: Cannot find a suitable office installation on your system.
ERROR: Please locate your office installation and send your feedback to:
http://github.com/dagwieers/unoconv/issues
我也已经尝试使用unoconv转换一些Word文档,但是(显然)也没有用。
我已经对这个问题进行了很多研究,并且找到了很多相关的话题,但是看来我真的无法弄清楚如何在虚拟机中解决问题。
我尝试过是否有帮助:
须藤apt-get install libreoffice-script-provider-python
但事实并非如此。我已经完成了有关easy_install uno
的研究,因为我已经在一个解决问题的主题中读到了一些相关内容,但是看起来这似乎没有任何意义。
此刻,我很遗憾没有更多的Linux经验。我需要习惯在终端窗口中执行所有操作。反正我别无选择。
有人可能对如何使unoconv在我的虚拟Ubuntu18.4计算机上工作有想法吗?也许我可以尝试任何步骤...我花了很多时间才能使此功能正常工作。这只是我项目的开始,也是第一步...