我们有大约200个文件定期从客户端进入我们的数据仓库。我正在尝试专门设计仓库的临时区域,我对在数据库中存储数据犹豫不决: -
我正在考虑为每种文件类型创建外部表,并直接从文件中获取数据并在转换后加载到维度。无论如何努力解决这些问题:
感谢您的帮助!
答案 0 :(得分:0)
数据复制是数据仓库中必不可少的恶魔。使用您的临时表,但不要将所有历史数据保存在其中。截断表,并在批处理运行时加载每个新文件。通过这种方式,您可以轻松访问最近加载的"批量记录,用于调试出现的任何问题,以及进行数据质量工作。
如果没有事先警告数据仓库团队,文件布局不应更改。如果是,则存在业务通信问题,而不是数据仓库问题。