TREC(文本检索会议)文件格式的技术结构是什么?

时间:2019-05-30 05:50:16

标签: java python xml full-text-search information-retrieval

我一直想知道TREC文件格式的内部结构。它只是一个带有.trec扩展名的XML文件还是更多呢? 通过将多个.xml文件转换为一个.trec文件,我是否需要将所有XML文件都放入一个XML文件中(当然,每个XML文件的内容现在都在一个XML文件中:

<DOC>
<DOCNO>document number</DOCNO>
<TEXT> content</TEXT>
</DOC>

)并重命名其扩展名还是应该执行一些特殊的操作?

如果有人知道技术细节,请帮助...

0 个答案:

没有答案