用于测试全文搜索的数据库

时间:2012-11-29 18:44:21

标签: database testing full-text-search

我需要使用lucene来测试全文索引和搜索,为此我正在寻找各种类型的许多文件(大约15 Gb)(pdf,doc,txt,xml,json ......)

我已经尝试过维基百科的数据库,但那些只给我一个xml文件。

任何人都可以建议我在哪里找到这样的数据库?

1 个答案:

答案 0 :(得分:1)

您可以尝试使用Full-Text Search with InnoDB。虽然使用http://dumps.wikimedia.org/会更好。