我找到了很多开源XML数据库(TPOX,Timber,DBXML),但他们正在研究XPath和XQuery,我需要一个为“XML文档关键字搜索”而开发的系统。
答案 0 :(得分:1)
我不确定“关键字搜索”是什么,但您可以设置一个搜索引擎,例如lucene / solr来索引您的数据,然后搜索它。
答案 1 :(得分:1)
许多XML数据库都在其中的XML文档中提供关键字索引。您不仅限于XPath表达式。您可以跨数据库中的所有文档进行关键字搜索。
通常,您可以在XQuery中表达关键字查询(并处理查询结果)。有关示例,请参阅exists-db:http://exist.sourceforge.net/kwic.html
支持关键字仅限于特定元素,或者您可以在整个文档中执行关键字。请参阅所有选项的XQuery全文规范:http://www.w3.org/TR/xpath-full-text-10/
BaseX是另一个支持全文(即关键字搜索)规范的开源XML数据库:http://www.inf.uni-konstanz.de/dbis/basex/
如果您想要在没有数据库的情况下进行开源全文搜索,尽管您可能想要查看较旧的XQengine - http://xqengine.sourceforge.net/ - 或者像其他人所说的那样,只需使用Lucene并将文档中的所有文本编入索引