我正在尝试在python中使用Tika来解析PDF文件。我正在使用python 2.7和Mac。我无法正常工作。我已经安装了它,然后:
from tika import parser
raw = parser.from_file('...file')
我收到此错误(为简便起见进行了编辑):
Retrieving http://search.maven.org/remotecontent ... to /var/folders/... [MainThread ] [INFO ] Retrieving http:// ... [MainThread ] [WARNI] Failed to see startup log message; retrying...
...
2019-04-08 14:53:05,910 [MainThread ] [ERROR] Tika startup log message not received after 3 tries.
2019-04-08 14:53:05,916 [MainThread ] [ERROR] Failed to receive startup confirmation from startServer.
我的问题与这里的Use tika with python, runtimeerror: unable to start tika server非常相似。最佳答案对我不起作用。我已经安装了Java 8,但仍然无法正常工作。我该怎么办?
答案 0 :(得分:0)
不确定这还是您或任何其他来这里的人是否有问题。即使您安装了Java 8(来自Oracle左右),终端仍会看到OSX随附的旧Java。
您需要告诉终端使用刚安装的新Java。将此放入您的.bash_profile
export JAVA_HOME =“ /库/ Internet插件/JavaAppletPlugin.plugin/Contents/Home /”
否则,检查系统偏好设置> Java> Java>视图>路径
您可以看到Java的路径,将所有内容复制到Home /并将其粘贴到 导出JAVA_HOME =“”
重新启动您的终端,tike应该现在可以工作