MarkLogic可以搜索平面文本文件吗? (即txt,tsv,csv)

时间:2014-04-10 20:59:57

标签: marklogic nosql

我知道MarkLogic是专为XML包装的数据而设计的。

我加载了一个txt文件,其中数据由制表符分隔,我一直在尝试在数据库中进行单词搜索,我以任何可能的方式加载txt文件。

我尝试使用search:search使用XQuery Query Console函数,但结果只给了我第一次出现的搜索关键字。我认为MarkLogic认为整个txt文件包含在1个XML标记中。

我希望能够搜索此平面文本文件,并获得与Google搜索结果页面类似的搜索结果。这可能吗?怎么样?或MarkLogic期望所有数据都是XML格式?

1 个答案:

答案 0 :(得分:3)

MarkLogic可以管理XML,JSON,二进制或文本内容。

你是如何加载数据的?对于制表符分隔的.csv类型文件,我建议加载内容泵http://docs.marklogic.com/guide/ingestion/content-pump#id_70366

.csv文件通常是关系表或excel的导出。在这种情况下,行成为MarkLogic中的单个文档。从您的描述中可以看出,文档是完整加载的,而不是分解为单个文档。这很容易在查询控制台中验证,就像您单击“浏览”按钮一样,您应该看到多个URI。如果您只看到一个加载的文档,那么您就知道该文档作为单个文档完整加载,这就是为什么您只能获得一个搜索结果。

是的,您可以使用MarkLogic获取Google样式搜索结果。您可能需要查看AppBuilder,因为它会使用Google样式结果快速为您生成搜索应用程序,并为搜索提供Google样式语法。如果您想自己推送,请查看REST API中的代码片段。

http://docs.marklogic.com/guide/app-builder/intro#chapter

http://docs.marklogic.com/guide/rest-dev/search#id_83997