标签: database testing full-text-search
我需要使用lucene来测试全文索引和搜索,为此我正在寻找各种类型的许多文件(大约15 Gb)(pdf,doc,txt,xml,json ......)
我已经尝试过维基百科的数据库,但那些只给我一个xml文件。
任何人都可以建议我在哪里找到这样的数据库?
答案 0 :(得分:1)
您可以尝试使用Full-Text Search with InnoDB。虽然使用http://dumps.wikimedia.org/会更好。