我在计算Jaccard Similarity方面存在这个问题,因为他在销售交易的MySQL数据库中使用事务ID查找类似的书籍:
t1 = Java,Ruby,C
t2 = Java,C#,Python
t3 = C#,VB,C
....等
Java交叉点的大小= 2; (我们怎么能找到它?)
联合的大小= 3,(我们怎么能找到它?)
Jaccard相似度=(交集/并集)= 2/3
但我不明白我怎么能找到两个向量的“交集”和“联合”或如何在Java / JSP中实现它。
请帮助我,非常感谢!