Python Tika解析器错误-无法从startServer接收启动确认

时间:2019-04-08 19:05:04

标签: java python apache-tika tika-server

我正在尝试在python中使用Tika来解析PDF文件。我正在使用python 2.7和Mac。我无法正常工作。我已经安装了它,然后:

from tika import parser
raw = parser.from_file('...file')

我收到此错误(为简便起见进行了编辑):

Retrieving http://search.maven.org/remotecontent ... to /var/folders/... [MainThread  ] [INFO ]  Retrieving http:// ... [MainThread  ] [WARNI]  Failed to see startup log message; retrying...
...
2019-04-08 14:53:05,910 [MainThread  ] [ERROR]  Tika startup log message not received after 3 tries.
2019-04-08 14:53:05,916 [MainThread  ] [ERROR]  Failed to receive startup confirmation from startServer.

我的问题与这里的Use tika with python, runtimeerror: unable to start tika server非常相似。最佳答案对我不起作用。我已经安装了Java 8,但仍然无法正常工作。我该怎么办?

1 个答案:

答案 0 :(得分:0)

不确定这还是您或任何其他来这里的人是否有问题。即使您安装了Java 8(来自Oracle左右),终端仍会看到OSX随附的旧Java。

您需要告诉终端使用刚安装的新Java。将此放入您的.bash_profile

export JAVA_HOME =“ /库/ Internet插件/JavaAppletPlugin.plugin/Contents/Home /”

否则,检查系统偏好设置> Java> Java>视图>路径

您可以看到Java的路径,将所有内容复制到Home /并将其粘贴到 导出JAVA_HOME =“”

重新启动您的终端,tike应该现在可以工作