Azure机器学习无法将PDF作为Web服务的输入

时间:2017-02-06 09:08:13

标签: azure azure-machine-learning-studio

我在azure ML上部署了一个随机森林实验,我试图根据它们包含的单词对文档进行评分。这些文件采用PDF格式。当我将此实验部署为Web服务时,它不允许我输入PDF。有没有办法将PDF输入到Web服务?

1 个答案:

答案 0 :(得分:0)

以下是一些可能的方法:

  • 在调用Web服务之前,序列化PDF的字节数据。在实验中的Execute R / Python Script模块中,反序列化数据并使用第三方软件包(例如Python的pickle和pdfminer)从PDF中提取文本。
  • 为PDF提供URI作为Web服务输入。使用Execute R / Python Script模块从该URI检索PDF文件,并使用第三方软件包(例如,urllib.requests和pdfminer for Python)提取文本。