IBM Watson,如何输入整本书的数据

时间:2017-04-21 22:20:17

标签: ibm-watson watson

我正在使用IBM Watson分析试验,它表示它只将数据作为CSV,Excel和其他一些数据。如何将书籍或文本正文转换为可接受的格式?谢谢

3 个答案:

答案 0 :(得分:0)

看起来WCA(Watson Context Analytics)的架构不支持PDF本身。请参阅IBM Link

中的以下图像

enter image description here

我认为将pdf转换为带有CONVERTER等转换器的文本并将其推送到数据库或其他文件会更好。 然后,您可以从中获取文本数据。

仅供参考,文件必须有一个KEY栏(即书名)。

答案 1 :(得分:0)

即使您将图书转换为可接受的文本格式(。csv .xls,.xlsx .sav),Watson Analytics也不会针对文本分析进行优化。听起来Watson Explorer是最适合您需求的产品。

希望这有帮助。

答案 2 :(得分:0)

即使CSV或XLS是文件的可接受格式,数据集也需要在特定结构中。您需要包含其后所有表和数据的标头。我不确定这本书的数据如何适合这种格式。

我最近在how to structure and refine data before importing into Watson Analytics上发布了此博文,以获得最佳效果。

根据您的具体要求,您可以按照Brennan上面的建议查看Watson Explorer,或者您可以学习使用IBM Content Analytics here.