我有一个SAS7BDAT文件目录 - 其中大约300个我需要将它们导入SQL Server表。不幸的是,日期字段不是数据集的一部分,而是在文件名中。所以我需要解析文件名,获取日期并在导入时附加到每个数据集。
SSIS是否适合这个?如果是这样,我是否使用For-each循环?如何解析文件名并附加日期?
对于单个文件,我可以轻松使用SQL Server Management Studio并导入它。我也可以为此练习做同样的事情,然后在加载到决赛桌时处理日期,但我希望有一个更清洁的解决方案。
在没有安装SAS的情况下,还有其他后端处理方法吗? Python还是其他?
TIA
答案 0 :(得分:0)
[解决]
遇到一篇提到R的SAS7BDAT库的文章。 所以使用它,我可以使用“ldply”将所有文件和文件名成功加载到R列表中。
在进行一些数据帧操作之后,我可以使用SQLSave将所有文件加载到SQL Server中。
文件非常小。因此,性能并不是一个问题,尽管我怀疑它可能适用于更大的数量。