输入将是文章,输出应该是FOAF中的rdf数据(如果有任何其他的......建议)。我的怀疑是:
1)我如何训练系统识别人员,地点等并生成rdf结构? 2)识别后我应该将它存储在数据库中,然后检索并生成rdf结构吗?还有其他方法吗?
3)我如何使用和应用OWL? (Web本体语言) 请指导我。 提前谢谢。
答案 0 :(得分:4)
命名实体识别(NER) - http://en.wikipedia.org/wiki/Named-entity_recognition(识别人和公司是人们经常做的事情,所以你应该没事,并找到大量的例子)。 OpenNLP,LingPipe和GATE只是可用于执行NER的一些工具。
如果您想使用OWL对RDF数据做一些推断,我建议您将RDF存储在三重存储中(有大量免费提供和开源三元存储)。
这取决于您选择的三重商店,有些商品为您提供OWL推理,或者您可以在向商店添加数据时使用推理引擎,并使用没有推理的三重商店(即完全实现)。但是,再次,这可能会或可能不会,这取决于您实际需要的推断量。