在Web应用程序中实现语义搜索

时间:2010-08-21 07:59:12

标签: rdf semantic-web owl jena

此Web应用程序是关于向Web应用程序发布不同类型的帖子,用户可以通过基于文本的搜索来搜索这些帖子。基本上帖子有以下属性。

   Title
   Description
   Category
   Budget 
   Submit_date
   End_date

目前,Post内容存储在'Post'表下的sql server数据库中。我想要做的是,对这些在应用程序中发布的帖子实施语义搜索。例如,当用户在搜索字段中键入“教育”时,系统应搜索该词“教育”的含义而不是其文本值。我喜欢使用Jena框架为基于RDF / OWL的解决方案。但我真的不知道如何启动它,因为我是语义网的新手。帮我构建这个搜索。 (如果你能提供样本申请/代码,那就更好了。)提前谢谢。

2 个答案:

答案 0 :(得分:4)

在开始执行一项非常重要的任务之前,我会说更加熟悉语义网技术,他们要解决的问题等等是明智之举。你可以先阅读/浏览“ Programming the Semantic Web“书,例如。

通过对什么是什么的高层次理解,你可以重新提出你的问题更具体,可能会分成几个不太常见的问题。 OWL和Jena是实现细节,首先您需要清楚地了解语义搜索将如何正常工作。您的帖子描述是否会由人类作者或机器进行语义注释?您还会使用类别来帮助您进行搜索吗?您是否会使用外部系统来查找“与'教育'相关的条款/概念/资源”等信息,或者您的系统是否会自行维护此信息?等等。

除非你认真对待语义,否则为了改善你的搜索,我建议从诸如词干之类的简单事情开始,所以搜索“教育”将返回提及“教育”,“未受过教育”的帖子和类似。添加一些像这样的简单技巧,也许你会意识到这就是你真正需要的......: - )

答案 1 :(得分:1)

  • 实现语义Web搜索引擎绝非易事。一 这样做的方法可以是基于a对帖子进行分类 本体论。现在,本体论需要随着时间的推移而发展 你可能想保留几个这样的本体进行搜索。该 我会做的方式是为帖子生成标签 分析帖子里面的文字。帖子通常只有标签 由作者自己定义,如果你能以某种方式添加更多的标签 ,它会使搜索时的帖子更加明显,还有更多 有用。获得标签后,您可以根据标签对其进行分类 你拥有的本体,然后建立在使用这些关系的基础上 本体。我可以建议使用“ opencalais ”(还有几个可供选择)网络服务 生成更多标签。使用一些您可以找到的标准本体 网络,根据您找到的新标签添加到他们。您发布的帖子越多 你将拥有更多的关系,从而获得更好的结果。

希望它能给你一个开始。