我们正在购买第三方调查数据。他们以SAS格式向我们提供数据。
源数据格式 - SAS 频率 - 每日 数据 - 完整的一年数据集(无delta)
我们希望每天将这些数据带入我们的Hadoop环境。我们有什么选择。
我们要求他们以文本文件发送数据。但他们的文本文件有8650列(例如国家..所以他们有250列 - 每个国家一列)。我们的ETL工具无法处理那么多列。据他们说,以SAS格式读取数据更容易。
任何建议..
THX
答案 0 :(得分:3)
这里的问题不是技术问题......听起来他们只是无益。我在SAS中完成了大部分工作,并且永远不会向某人提供包含许多列的表,并期望他们导入它。
即使他们以SAS格式发送它,SAS数据集仍将具有相同数量的列和ETL工具(即使它可以读取SAS数据集 - 这是不太可能的)仍然可能失败。 / p>
告诉他们在SAS中转置数据,以便减少列数,然后将其作为文本文件重新发送。
答案 1 :(得分:0)