我下载并使用了OpenIE4.1 jar文件(可从http://knowitall.github.io/openie/下载)来处理一些自由文本文档并生成类似三元组的输出以及文本和置信度分数,例如,
The rail launchers are conceptually similar to the underslung SM-1
0.93 (The rail launchers; are; conceptually similar to the underslung SM-1)
我写了一个java解析器来提取OpenIE三元组,其置信度得分> = 0.85和 需要知道将其转换为N-triplet(NT)的方式,格式看起来像。
不确定我是否需要熟悉我尝试映射的本体。
答案 0 :(得分:1)
与同事讨论后。这是我应该做的创建N-Triplet(NT)和详细Java代码可以在另一个问题中找到:Use RDF API (Jena, OpenRDF or Protege) to convert OpenIE outputs
创建这些三元组:
1. node_s rdf:type <http://mypage.org/vocab#Corpus>
2. node_s dc:title “The rail launchers”
3. node_s dc:source “Sample File”
4. node_s rdf:predicate <http://mypage.org/vocab#are>
5. node_o rdf:type <http://mypage.org/vocab#Corpus>
6. node_o dc:title “conceptually similar to the underslung SM-1”