在tika中, perser.from_file()无法读取 svn 数据,我认为这是由于用户身份验证所致。在通过http网络访问期间如何使用用户身份验证。
注意:代码在python
中
import os<br/>
from tika import parser <br/>
def str_Search(str_FilePath, str)<br/>
parsedPDF =perser.from_file("https://xxx.xx.xxx.xx/svn/14488/xxx/xxx/xxxx.docx")<br/>
text = parsedPDF['content']<br/>
print(text)<br/>