提卡只会让我打印。如果我除了打印已解析的内容外,什么都不会得到415错误代码或内容的关键字错误。我需要保存

时间:2019-04-26 00:11:41

标签: python apache-tika

除打印功能外,我无法使Tika与任何其他产品一起使用。有人知道这里发生了什么吗?

  • 我绑定了test = str(raw1)并获得错误代码415
  • 我尝试了test = word_tokenize(raw1 ['content'])并获取内容的关键字错误
  • 我尝试了其他一些操作,但是除了打印外什么都无法工作。它将解析的文本完美打印到终端。

    def loopexttok(self, event=None): get_file_Location = self.n_string.get() for root, dirs, files in os.walk(get_file_Location): for file_name in files: import tika from tika import parser raw1 = parser.from_file(file_name) print(raw1)

我原本希望将代码另存为str或从解析后的文本创建句子的字典,然后将其与其他代码一起清理并放入数据库中,但是除了打印解析后的内容外,Tika无法做任何事情文字。

此外,如果我不直接在解析器调用的上方导入Tika,则Tika根本无法工作。

0 个答案:

没有答案