我有两个下面描述的数据集
data1:
$restaurant $reviewers
A Tom
B Jack.Mary.Joan
C Tom.Joan
D Rose
data2 (sorted by the friends numbers):
$user $friends
Tom Joan.Mary.Jack
Jack Tom.Rose
Mary Tom
Joan Tom
问题是通过对朋友的评论来计算这些用户的评论中的重叠。
以Tom为例,Toms朋友评论的餐厅是B和C,C也是由Tom审核的。所以这里百分比是C / B + C = 1/2,所以重叠是50%。
我认为我需要一个循环来处理两个数据集,但是对于SAS的基本知识,我不知道如何。有人有想法吗?
非常感谢。
答案 0 :(得分:0)
你应该尝试这样的事情。
5*35
我确实为汤姆获得了0.5的价值,但也许你有错误。 因此,您可以根据需要调整代码。
我从这里遵循逻辑: How to check percentage overlap in SAS