识别Graph API中的重复帖子

时间:2014-07-23 12:50:06

标签: facebook facebook-graph-api

在FB图形API上识别重复内容时出现问题。

如果相册已多次发布到时间轴,则会在结果中多次使用不同的linkobject_id& post_id属性。

因此,我的代码无法判断喜欢的数量始终为n (number of duplicates) * actual_like_count

如何避免两次计数?

编辑:这是一些示例数据

type     status_type  link                 likes comments shares
photo    added_photos a.xxx.yyy.zzz/mmm    48    6        1
photo    ""           a.xxx.yyy.zzz/ppp    48    1        0
photo    added_photos a.xxx.yyy.zzz/ppp    48    1        19

在此示例中,尽管具有相同的专辑ID(xxx),但所有指标都不同。

以下是具有完全相同链接结构的重复计数的示例

type     status_type  link                 likes comments shares
photo    added_photos a.xxx.yyy.zzz/qqq    63    3        0
photo    ""           a.xxx.yyy.zzz/rrr    63    3        0
photo    added_photos a.xxx.yyy.zzz/sss    63    3        0

请注意,在第一个表中,链接中斜杠后面的部分与后两行匹配,但仍然是不同的指标。

object_id永远不同

1 个答案:

答案 0 :(得分:0)

发布到时间轴的相册将有一个与之关联的post_id,它将始终不同,但相册的链接保持不变。您可以尝试比较每张专辑的链接。

https://www.facebook.com/photo.php?fbid=xxx&set=a.yyy.zzz.aaa&type=b&relevant_count=c

在大多数情况下,链接将始终相同。从我所看到的情况来看,链接中的set参数通常会有一个指向相册的链接,这些链接对于重复的帖子是相同的:

通常看起来像:

set=a.xxx.yyy.zzz.zzz

a.xxx是相册ID。您可以通过调用图谱API上的/xxx来查看相册详情。