我正在实现一种从语义Web数据中挖掘关联规则的方法。我正在复制Molood等人的工作。 (2017)。我需要有关一种算法的帮助,该算法可根据常见行为集(交易)生成关联规则。即喜欢
{约翰·列侬,乔治·哈里森} :(乐器,吉他)==>(职业,SongWriter)
我要复制的SWARM方法有两个模块 1.预处理模块(包含两个子模块) 一种。语义项生成 b。常见行为集生成 2.以及采矿模块,其中包含: 关联规则生成。
从DBpedia Ontology数据集中获得以下示例数据集
t1 |约翰·列侬|仪器|吉他 t2 |乔治·哈里森|仪器|吉他 t3 |比尔·克林顿|办公室|美国总统 t4 |吉米·卡特办公室|美国总统 t5 |约翰·列侬|职业歌曲作者 t6 |乔治·哈里森|职业歌曲作者 t7 |比尔·克林顿|派对|民主的 t8 |吉米·卡特派对|民主的
语义项生成算法: 输入:三元组 输出:SI(语义项)
语义项生成算法将Triples文件作为输入和输出语义项,例如。 ------------------------------------- 语义项 -------------------------------------
常用行为集算法将语义项和相似度作为输入和输出常用行为集,例如:
cbs-1 {约翰·列侬,乔治·哈里森}(乐器,吉他)
cbs-2 {吉米·卡特,比尔·克林顿}(办公室,美国总统)
我需要一个高效的算法来帮助您,该算法将采用常见的行为集和最小支持值来生成以下形式的关联规则
r-2 {吉米·卡特,比尔·克林顿} :(办公室,美国总统)==>