是否有一种算法可从语义网(知识库)数据中生成关联规则

时间:2019-07-05 15:47:14

标签: java algorithm owl semantic-web rdfs

我正在实现一种从语义Web数据中挖掘关联规则的方法。我正在复制Molood等人的工作。 (2017)。我需要有关一种算法的帮助,该算法可根据常见行为集(交易)生成关联规则。即喜欢

{约翰·列侬,乔治·哈里森} :(乐器,吉他)==>(职业,SongWriter)

我要复制的SWARM方法有两个模块 1.预处理模块(包含两个子模块)     一种。语义项生成     b。常见行为集生成 2.以及采矿模块,其中包含:  关联规则生成。

从DBpedia Ontology数据集中获得以下示例数据集

三重|主题|谓词对象

t1 |约翰·列侬|仪器|吉他    t2 |乔治·哈里森|仪器|吉他    t3 |比尔·克林顿|办公室|美国总统    t4 |吉米·卡特办公室|美国总统    t5 |约翰·列侬|职业歌曲作者    t6 |乔治·哈里森|职业歌曲作者    t7 |比尔·克林顿|派对|民主的    t8 |吉米·卡特派对|民主的

语义项生成算法: 输入:三元组 输出:SI(语义项)

  1. SI = NULL
  2. foundFlag = false
  3. 对于三元组中的每个三元组tj
  4. pa_ = tj对
  5. 针对SI中的每个si _
  6. 如果pa_ = si.pa,那么
  7. 将tj的主题添加到si.es;
  8. foudFlag = true;
  9. 如果foundFlag = false,那么
  10. 新语义项si _;
  11. si_ = tj;
  12. 将si_添加到SI
  13. foundFlag = false;
  14. 返回SI

语义项生成算法将Triples文件作为输入和输出语义项,例如。          -------------------------------------                     语义项          -------------------------------------

si-1 {John Lennon,George Harrison}(乐器,吉他)

si-2 {约翰·列侬,乔治·哈里森}(职业,歌曲作者)

s1-3 {吉米·卡特,比尔·克林顿}(办公室,美国总统)

s1-4 {吉米·卡特,比尔·克林顿}(政党,民主)

常用行为集算法将语义项和相似度作为输入和输出常用行为集,例如:


常见行为集

cbs-1 {约翰·列侬,乔治·哈里森}(乐器,吉他)

{约翰·列侬,乔治·哈里森}(职业,歌曲作者)

cbs-2 {吉米·卡特,比尔·克林顿}(办公室,美国总统)

{吉米·卡特,比尔·克林顿}(政党,民主)

我需要一个高效的算法来帮助您,该算法将采用常见的行为集和最小支持值来生成以下形式的关联规则


关联规则

r-1 {约翰·列侬,乔治·哈里森} :(乐器,吉他)==>(职业,歌曲作者)

r-2 {吉米·卡特,比尔·克林顿} :(办公室,美国总统)==>

(政党,民主)

0 个答案:

没有答案