我一直在关注Hadoop,这似乎是一项伟大的技术。 Map / Reduce,Clustering它只是好东西。但是我没有找到任何关于在SQL Server中使用Hadoop的文章。
假设我有一个巨大的索赔表(6亿行),我想利用Hadoop。我在想但是如果我错了就纠正我,我可以查询我的表并提取所有数据并将其插入任何类型的块中的hadoop(xml,json,csv)。然后我可以利用至少6台机器的Map / Reduce和Clustering,并将我的SQL Server留给其他任务。我只是在这里扔骨头我只是想知道是否有人做过这样的事情。
答案 0 :(得分:2)
在关系数据库中导入和导出数据是Hadoop的一个非常常见的用例。看看Cloudera的Sqoop实用程序,它将帮助您完成此过程: