在FB图形API上识别重复内容时出现问题。
如果相册已多次发布到时间轴,则会在结果中多次使用不同的link
,object_id
& post_id
属性。
因此,我的代码无法判断喜欢的数量始终为n (number of duplicates) * actual_like_count
。
如何避免两次计数?
编辑:这是一些示例数据
type status_type link likes comments shares
photo added_photos a.xxx.yyy.zzz/mmm 48 6 1
photo "" a.xxx.yyy.zzz/ppp 48 1 0
photo added_photos a.xxx.yyy.zzz/ppp 48 1 19
在此示例中,尽管具有相同的专辑ID(xxx),但所有指标都不同。
以下是具有完全相同链接结构的重复计数的示例
type status_type link likes comments shares
photo added_photos a.xxx.yyy.zzz/qqq 63 3 0
photo "" a.xxx.yyy.zzz/rrr 63 3 0
photo added_photos a.xxx.yyy.zzz/sss 63 3 0
请注意,在第一个表中,链接中斜杠后面的部分与后两行匹配,但仍然是不同的指标。
object_id
永远不同
答案 0 :(得分:0)
发布到时间轴的相册将有一个与之关联的post_id,它将始终不同,但相册的链接保持不变。您可以尝试比较每张专辑的链接。
https://www.facebook.com/photo.php?fbid=xxx&set=a.yyy.zzz.aaa&type=b&relevant_count=c
在大多数情况下,链接将始终相同。从我所看到的情况来看,链接中的set
参数通常会有一个指向相册的链接,这些链接对于重复的帖子是相同的:
通常看起来像:
set=a.xxx.yyy.zzz.zzz
a.xxx
是相册ID。您可以通过调用图谱API上的/xxx
来查看相册详情。