应用错误收集

比较器在python

时间：2017-03-24 07:17:16

标签： python sorting hadoop-streaming

运行此命令以排序数据： -D mapreduce.job.output.key.comparator.class = org.apache.hadoop.mapreduce.lib.partition.KeyFieldBasedComparator \ -D mapreduce.partition.keycomparator.options = -k1n，2n \

我可以在我的reducer中看到相同的键存在，但它们没有按顺序排列

格式是键（field1）\ t键（field2）|值由|分隔它正在运行小数据集但是当我接受大数据集时，数据被分区但没有排序。可以提供任何身体帮助吗？

0 个答案:

没有答案

高效的Hadoop Word计数大文件
Hadoop Streaming Python Trivial示例不起作用
Python Hadoop流与导入包未安装在数据节点上
用hadoop进行python流不通
一起使用Hadoop分区程序和比较器类
仅处理大型文件时hadoop 2.6流式传输出错
Hadoop作业未实现数据位置
比较器在python
Hadoop Streaming Job无法在OOzie中运行
使用纱线比较器在MapReduce Python中进行字数排序

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？