数据库有一个表?

时间:2014-07-12 12:35:21

标签: database database-design

我正在创建一个工具,根据特定条件搜索Craigslist帖子。如果有新帖子,它会发送一封电子邮件。该工具最终将与cron定期运行。

首先,我考虑将帖子内容(链接,标题,内容)存储在数据库中。然后,对于工具的每次调用,它将刮取它可以找到的所有帖子并检查数据库以查看它是否真的是新的。

这意味着数据库包含单个表(帖子)和四列(id,link,title,content)。这个应用程序有多大功能吗?使用单个表,没有关系,因此关系数据库的使用受限。平面文件会更好吗?

1 个答案:

答案 0 :(得分:0)

如果您只需要知道帖子是否是新的,那么您只需将帖子内容的哈希值存储到文件中即可。重新扫描新帖子时,请计算其哈希值,如果该值不在文件中则为新值。在发送电子邮件后,将该哈希值添加到文件中。

为防止文件变得过大,您可以在值上放置日期并在一定时间后丢弃它们。更优雅的方法是丢弃在最近一次运行中未找到的任何哈希值。