应用错误收集

Hadoop和MS SQL Server最佳实践

时间：2010-09-30 14:35:54

标签： sql database hadoop mapreduce cluster-computing

我一直在关注Hadoop，这似乎是一项伟大的技术。 Map / Reduce，Clustering它只是好东西。但是我没有找到任何关于在SQL Server中使用Hadoop的文章。

假设我有一个巨大的索赔表（6亿行），我想利用Hadoop。我在想但是如果我错了就纠正我，我可以查询我的表并提取所有数据并将其插入任何类型的块中的hadoop（xml，json，csv）。然后我可以利用至少6台机器的Map / Reduce和Clustering，并将我的SQL Server留给其他任务。我只是在这里扔骨头我只是想知道是否有人做过这样的事情。

1 个答案:

答案 0 :(得分：2)

在关系数据库中导入和导出数据是Hadoop的一个非常常见的用例。看看Cloudera的Sqoop实用程序，它将帮助您完成此过程：

http://incubator.apache.org/projects/sqoop.html

Crystal Reports最佳实践
开发和测试环境最佳实践？
SQL连接方法和最佳实践
Hadoop和MS SQL Server最佳实践
加速SQL Server 2008标准版 - 最佳实践？
嵌套查询：最佳实践
使用Datetimeoffset的最佳实践
SQL Server代理最佳实践
存储过程最佳实践
调试SQL脚本的最佳做法？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？