标签: json dataset comparison
我有一个从网站抓取的数据集,并试图每小时进行一次更新。每个数据都是一个大约5-20个字符的字符串。
此网站仅以json进行响应,其中包含了全部数据集(非常大且没有时间戳,按字母顺序排序)。但同时,每天只有一两个新数据。
我正在将它们与一个完整的循环进行比较,这似乎是在浪费计算。
有没有适合这种情况的算法?