我需要自动化一个进程,将新数据文件加载到数据库中。我的问题是以自动方式确定哪些文件是“新”的最佳方法。
从每晚同步的目录中检索文件,因此文件列表不断增长。我没有选择删除我已经检索过的文件。
新记录存储在原始数据表中,该表具有指示每个记录所源自的文件名的字段,因此我可以将当前目录中的所有文件名与原始数据表中已有的文件名进行比较,并仅处理那些文件名。不相同。
或者我可以使用文件名中的时间戳,并仅处理自上次运行导入过程以来创建的文件。
我倾向于使用第一种方法,因为它似乎不太容易出错,但我没有太多运气,发现这是否真的如此。通过将所有文件名与数据库中已有的文件名进行比较,以这种方式确定新文件有哪些缺陷?