我正在寻找 TREC格式的规格。我一直在谷歌搜索,但我没有找到线索。
有没有人知道在哪里可以找到有关它的信息?
答案 0 :(得分:4)
AFAIK TREC是NIST的Text REtrieval Conference的缩写。为了使索引器知道文档边界在文件中的位置,每个文档必须具有开始文档和结束文档标记。这些标签类似于HTML或XML标签,实际上是TREC文档的格式。
TrecParser:此解析器可识别TEXT,HL,HEAD,HEADLINE,TTL和LP字段中的文本。
来源:Lemur Guide
答案 1 :(得分:0)
答案 2 :(得分:0)
这也是TechSmith Camtasia的新录音文件格式。 https://feedback.techsmith.com/techsmith/topics/mac_upgrade-ri5ox
答案 3 :(得分:0)
它也是IBM Watson用于知识提取的文件格式