标签: java hadoop mapreduce
我做了一些加入操作,包括mapside和reduce side,以及小数据集。我正在寻找一个用于衡量集群性能的千兆字节公开数据集。你们有没有可能的多对多连接数据集?