共现计算

时间:2013-01-16 19:00:07

标签: oracle11g collaborative-filtering

我有一个包含两列的表格:

(doc_id, keyword_id) 

我想计算数据库中文档上两个关键字的共现。我正在使用Oracle 11g数据库。计算需要一年时间。 我有7000个文档和5000个关键字。

Co-occurrence (keyword1, keyword2)=025.

1 个答案:

答案 0 :(得分:0)

我假设您还有一些count列?您将在doc_id上将自己加入表中,然后按keyword_id的两个实例(从每个对连接中相同表的引用)进行分组,并同时选择keyword_id和计数产品的sum