我需要使用RSS提要中的数据填充数据库。反正是否确保我没有使用重复信息填充数据库?
我不想比较数据库中的数据以确定我是否有重复的信息,因为这将非常慢。
与此问题类似How to detect changed and new items in an RSS feed?,但答案并非我所期待的。
答案 0 :(得分:2)
您通常希望使用GUID-Element of an Item执行重复检查。
如果您已经知道物品的指示,那么您已经看过它了。
答案 1 :(得分:0)
我相信您的问题的标题和您对它的描述不匹配:)
如果您希望在RSS源更新时收到通知,则必须使用专为此设计的PubSubHubbub协议。只有发布者在其Feed中支持它时,它才会起作用。您还可以检查Superfeedr以查找所有其他Feed。 (我创建了Superfeedr!)。
现在,如果您想知道如何确保两次不保存相同的数据,推荐的方法是映射RSS的<GUID>
元素或Atom的<id>
元素你的数据存储区。它将涉及将Feed中的所有这些项目与您之前存储的项目进行比较。对于大多数Feed来说,它不应该太昂贵,因为它们通常不包含数百个条目。