我正在使用IBM Watson分析试验,它表示它只将数据作为CSV,Excel和其他一些数据。如何将书籍或文本正文转换为可接受的格式?谢谢
答案 0 :(得分:0)
看起来WCA(Watson Context Analytics)的架构不支持PDF本身。请参阅IBM Link
中的以下图像我认为将pdf转换为带有CONVERTER等转换器的文本并将其推送到数据库或其他文件会更好。 然后,您可以从中获取文本数据。
仅供参考,文件必须有一个KEY栏(即书名)。
答案 1 :(得分:0)
即使您将图书转换为可接受的文本格式(。csv .xls,.xlsx .sav),Watson Analytics也不会针对文本分析进行优化。听起来Watson Explorer是最适合您需求的产品。
希望这有帮助。
答案 2 :(得分:0)
即使CSV或XLS是文件的可接受格式,数据集也需要在特定结构中。您需要包含其后所有表和数据的标头。我不确定这本书的数据如何适合这种格式。
我最近在how to structure and refine data before importing into Watson Analytics上发布了此博文,以获得最佳效果。
根据您的具体要求,您可以按照Brennan上面的建议查看Watson Explorer,或者您可以学习使用IBM Content Analytics here.