我知道MarkLogic
是专为XML包装的数据而设计的。
我加载了一个txt文件,其中数据由制表符分隔,我一直在尝试在数据库中进行单词搜索,我以任何可能的方式加载txt
文件。
我尝试使用search:search
使用XQuery
Query Console
函数,但结果只给了我第一次出现的搜索关键字。我认为MarkLogic
认为整个txt
文件包含在1个XML
标记中。
我希望能够搜索此平面文本文件,并获得与Google搜索结果页面类似的搜索结果。这可能吗?怎么样?或MarkLogic
期望所有数据都是XML
格式?
答案 0 :(得分:3)
MarkLogic可以管理XML,JSON,二进制或文本内容。
你是如何加载数据的?对于制表符分隔的.csv类型文件,我建议加载内容泵http://docs.marklogic.com/guide/ingestion/content-pump#id_70366
.csv文件通常是关系表或excel的导出。在这种情况下,行成为MarkLogic中的单个文档。从您的描述中可以看出,文档是完整加载的,而不是分解为单个文档。这很容易在查询控制台中验证,就像您单击“浏览”按钮一样,您应该看到多个URI。如果您只看到一个加载的文档,那么您就知道该文档作为单个文档完整加载,这就是为什么您只能获得一个搜索结果。
是的,您可以使用MarkLogic获取Google样式搜索结果。您可能需要查看AppBuilder,因为它会使用Google样式结果快速为您生成搜索应用程序,并为搜索提供Google样式语法。如果您想自己推送,请查看REST API中的代码片段。