我正在为一个聊天机器人开发一个大学项目,该机器人可以根据dbpedia的RDF数据集回答各种问题。 目前,聊天机器人非常具体,能够回答与Marvel电影的子域有关的问题。我的目标是进行概括,特别是通过使用Elasticsearch索引dbpedia内容,然后尝试使用这些索引进行查询。
但是,我不了解Elasticsearch,也从未从事过索引工作。特别是,我很难理解如何预处理dbpedia数据集,然后如何思考索引。我想就该策略提出一些建议。
非常感谢
答案 0 :(得分:0)
Elasticsearch为您提供了一个搜索和存储数据的平台。这并不意味着您只能使用Elasticsearch来从某处获取或读取数据。实际上,您需要在Elastic Stack上搜索。
有关更多信息,在此图中,您的数据位于右侧的客户端服务器。您需要使用某些脚本或Elastic Stack产品(例如logstash,filebeat等)将数据从源获取到Elasticsearch。之后,您将完全了解您的数据结构以快速进行搜索。 Elasticsearch首次将处理所有数据结构问题,例如映射,但这会使您的搜索有些慢。您需要change your mapping。因此,您需要阅读一些文档。将数据发送到Elasticsearch之后,您可以使用Kibana可视化数据。对于更专业的问题,如果找不到或无法理解,请首先转到Elasticsearch documentation。
另外,请检查Elasticsearch的图形功能
https://www.elastic.co/elasticon/conf/2016/sf/graph-capabilities-in-the-elastic-stack
是否适合DBpedia。
编辑:经过更多研究,我发现了一些非常好的东西。这里的链接: