将sas数据导入hadoop

时间:2014-04-09 15:34:44

标签: hadoop sas

我们正在购买第三方调查数据。他们以SAS格式向我们提供数据。

源数据格式 - SAS 频率 - 每日 数据 - 完整的一年数据集(无delta)

我们希望每天将这些数据带入我们的Hadoop环境。我们有什么选择。

我们要求他们以文本文件发送数据。但他们的文本文件有8650列(例如国家..所以他们有250列 - 每个国家一列)。我们的ETL工具无法处理那么多列。据他们说,以SAS格式读取数据更容易。

任何建议..

THX

2 个答案:

答案 0 :(得分:3)

这里的问题不是技术问题......听起来他们只是无益。我在SAS中完成了大部分工作,并且永远不会向某人提供包含许多列的表,并期望他们导入它。

即使他们以SAS格式发送它,SAS数据集仍将具有相同数量的列和ETL工具(即使它可以读取SAS数据集 - 这是不太可能的)仍然可能失败。 / p>

告诉他们在SAS中转置数据,以便减少列数,然后将其作为文本文件重新发送。

答案 1 :(得分:0)

谢谢大家......

我认为,这可以解决我的问题:

http://www.ats.ucla.edu/stat/sas/modules/tolong.htm