应用错误收集

hadoop hbase比较行相同的表

时间：2015-08-06 20:22:50

标签： java hadoop mapreduce hbase

我想写一个map-reduce或multiple来比较行。

我无法在没有在减速器中做任何事情的情况下编写它。

对于数百万行，这可能需要我很多时间来比较整个数据集。我怎么能实现这个目标呢？

我不在乎PIG。这是一个我将扩展的简单案例（我在PIG中无法做到的事）

1 个答案:

答案 0 :(得分：0)

有些问题要问你想比较最后一张唱片吗？ 2.如果是的话，对于上面那可能是，我担心你没有选择而不是依赖于reducer来获取整个数据 3.如果答案为否，并且您想要跳过集合的其余部分，那么当进行特定比较并满足时，您可以在地图中验证它自己并且不向mapper输出写入任何内容。但是，仍然会有其他地图在运行，因此在这种情况下，一旦比较成功，您应该退出作业

Hbase Map和Reduce在同一张桌子上
基于Java中的时间戳获取HBase表行
比较使用Hadoop和不使用Hbase的性能
hadoop hbase比较行相同的表
HBase：使用与现有表
如何从Hbase中的表中的特定行检索信息？
如何选择行的一部分并在HBase中创建新表？
如何在HBase shell中获取表中的自定义行数
比较最后两个版本，仅读取HBase中的更新值
HBase Shell缓慢放入几行表中（独立模式）

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？