我有一个项目数据库表,让我们称之为游戏。每个游戏都有一个发布日期
我运行一个随机选择游戏的脚本,并从源数据中更新各种信息,如价格等。这个脚本是全天定期发射的cron
有超过20,000个奇怪的游戏记录并且在不断增长,所以显然这些游戏中的一些保持更新比其他游戏更重要。这主要基于发布日期,但也可能包括其他领域的数据。
有没有什么方法可以让我的批处理脚本根据这个重要性来选择一个记录,而不必在每个结果都更新后再运行所有结果然后从顶部开始?
那么更新重要游戏的频率会高于不太重要的游戏吗?
答案 0 :(得分:0)
正如@Usman所提到的,您需要定义一种测量重要性的方法,该方法可以正常工作。然后,我的建议是让你的脚本每次运行时都更新两条记录。您可以从“重要”记录中随机选择其中一条记录,从所有记录中随机选择另一条记录。
这样你就不会降低更新任何给定记录的概率,同时也会增加更新重要记录的可能性。
但是,您知道,即使您每秒运行一次随机更新脚本,也无法保证您每天都能获得所有20,000条记录。你一周没有更新的游戏的粉丝可能会因你的数据陈旧而烦恼。最好按固定的时间表更新内容,或者为它们获取新数据,而不是随机更新。