我有一个包含两列的表格:
(doc_id, keyword_id)
我想计算数据库中文档上两个关键字的共现。我正在使用Oracle 11g数据库。计算需要一年时间。 我有7000个文档和5000个关键字。
Co-occurrence (keyword1, keyword2)=025.
答案 0 :(得分:0)
我假设您还有一些count
列?您将在doc_id
上将自己加入表中,然后按keyword_id
的两个实例(从每个对连接中相同表的引用)进行分组,并同时选择keyword_id
和计数产品的sum
。