我想通过将“文本文件/文档”作为输入来创建“RDF triple”。它意味着像portege-OWL这样的工具,它将文本文件转换为RDF三元组。
我可以知道如何执行此操作的步骤。以及执行此操作所需的所有工具是什么。
对此有任何一个帮助表示赞赏。
谢谢, 巴布
答案 0 :(得分:7)
您应该在文本中举例说明您的本体。我想你的输入不是RDF / XML格式。如果您的数据以自定义文本文件格式保存,那么您可能找不到能够执行此转换的工具。这完全是预期的,因为没有工具可以实际猜测非结构化文档的格式是什么,除非它遵循一个。因此,我想你必须编写一个自定义转换器。
您可以用您喜欢的任何语言编写转换器,因为输出可能是描述本体的RDF / XML文档。 RDF / XML实际上是一个XML文件,这意味着您唯一需要的是使用XML解析库创建XML文件。然后,您可以使用RDF / XML文档将其导入Protege并执行您想要的任何操作。由于您的编程语言是Java,您可以使用JAXP或任何其他XML库(here您可以找到替代方案)来完成。
另一种途径是使用Apache Jena这是一个java API来处理本体(包括RDF模型),然后你也可以处理创建的本体模型。我相信耶拿是一个更好的方法(如果你熟悉它)。
无论如何,我不相信有一个工具可以帮助你。你必须以艰难的方式进行源文本解析。 没有工具可以识别源文本的哪一部分用于声明RDF类或自定义文本格式的属性。如果您使用某些文本解析库,也许您的工作会更容易FFP但仍然你必须自己做。
希望我帮忙!