将OpenIE三元组转换为N-Triplet(NT)

时间:2014-07-15 22:50:57

标签: java nlp rdf owl

我下载并使用了OpenIE4.1 jar文件(可从http://knowitall.github.io/openie/下载)来处理一些自由文本文档并生成类似三元组的输出以及文本和置信度分数,例如,

The rail launchers  are conceptually similar to the underslung SM-1
0.93 (The rail launchers; are; conceptually similar to the underslung SM-1)

我写了一个java解析器来提取OpenIE三元组,其置信度得分> = 0.85和 需要知道将其转换为N-triplet(NT)的方式,格式看起来像。

不确定我是否需要熟悉我尝试映射的本体。

1 个答案:

答案 0 :(得分:1)

与同事讨论后。这是我应该做的创建N-Triplet(NT)和详细Java代码可以在另一个问题中找到:Use RDF API (Jena, OpenRDF or Protege) to convert OpenIE outputs

  1. 为文件中的每个distinct:subject创建一个空白节点标识符(称之为node_s)
  2. 为文件中的每个distinct:对象创建一个空白节点标识符(称之为node_o)
  3. 为每个不同的谓词定义URI
  4. 创建这些三元组:

    1.  node_s              rdf:type                <http://mypage.org/vocab#Corpus>
    2.  node_s              dc:title                 “The rail launchers”
    3.  node_s              dc:source            “Sample File”
    4.  node_s              rdf:predicate      <http://mypage.org/vocab#are>
    5.  node_o              rdf:type                <http://mypage.org/vocab#Corpus>
    6.  node_o              dc:title                 “conceptually similar to the underslung SM-1”