自定义ATOM Feed在Google阅读器中复制我的条目

时间:2012-03-26 13:33:43

标签: xml c#-4.0 duplicates atom-feed feedburner

我遇到了一个问题,我正在生成一个ATOM Feed,而且这些条目在读者中是重复的。

我开发了一个C#类来创建ATOM提要条目,并最终创建了一个来自我的数据元素的完整提要对象。它符合Atom Syndication Feed Format的RFC 4287。

正确生成Feed。它目前没有验证,因为我正在添加两个非标准扩展元素,但还没有为它创建一个合适的命名空间,但即使验证它也存在这个问题。

我还看到了我的直接Atom Feed和FeedBurner Feed之间的两种不同行为。

以下是两个Feed。 http://feeds.feedburner.com/oldtownhome/ http://www.oldtownhome.com/index.atom

我已经通过Google阅读器订阅了两个Feed,并且其他用户的报告显示他们看到了同样的问题,但是当他们看到问题与我对比时,它并不一致。

Feed#1的问题: 当前在Feed中的Feed项(25个条目Feed)随机复制。这可以在一天内作为单个副本,在几天内重复多个项目,或者有时整个Feed内容在一天内“重新发布”,即使它们在前几天已经存在。

Feed#2的问题: 邮件似乎随机复制,即使条目从主要订阅源中删除(尽管它们可以通过网站上的其他Atom订阅源提供,例如单个类别的Atom订阅源)。

我已经完成了我能想到的一切。我确保pubDate永远不会改变,文档的每个链接从发布时起都是不变的,添加了一个节点,帖子的实际和不变的guid作为值,但似乎没有任何帮助。我甚至强迫feedburner使用我的XML,希望问题可能出现在feedburner中。

我很茫然,我希望其他人也有类似的情况并提出一些建议。

更新 一个可能相关的项目,我的feedburner发送了昨天发送的电子邮件,其中“最新帖子”报告了25个新帖子(主要摘要中的总数,用于获取此信息)。在这25个职位中,有24个不是新职位,并且在之前的30天左右一次交付了一个。只有一个帖子是新的,它在顶部与其余信息混在一起。

这是否可能与Feedburner无法访问我的Feed(因为它已关闭或某些东西)的某些连接问题有关,然后当它重新联机时Feedburner的东西全部内容都是新的?我的服务器已经超过一年没有出现任何延期中断,但问题可能持续30秒到5分钟。

这是最令人沮丧的问题,因为Feedburner / Google Reader都是这样的黑盒子。

1 个答案:

答案 0 :(得分:2)

如果有人在寻找重复的Google阅读器后期解决方案时偶然发现这篇随机文章,我想我可能已经发现了问题的根本原因,这很烦人。

博客有很多原子供稿,但只有一个主要供稿。主要Feed在任何给定时间列出了25个最新帖子,但除了该Feed之外,内容的元数据中还列出了其他可发现的Feed。这些包括类别供稿,评论供稿,特定于页面的供稿,热门帖子供稿等。看起来谷歌阅读器的所有智慧都在抓取所有这些供稿并将它们全部视为绝对不同的供稿和商品,即使它们所有帖子都有相同的唯一ID(帖子的网址)。一旦我将所有这些作为可发现的Feed删除,并且还确保将主要的非www源重定向到带有www的那个,以确保所有URL都是唯一且不重复的,所有这些似乎都适用于全世界并且Google阅读器不是更长时间复制内容。

嗯,这是几个月的令人讨厌和令人沮丧的项目,试图解决一个绝对无法调试或为开发人员提供有用信息的服务的问题。

我希望有一天能帮助别人。