我正在寻找一个多服务器大数据样本应用程序,可用于(a)试验安装和配置大数据应用程序,以及(b)作为开发此类应用程序的示例起点 - 编辑代码,进行一些更改等等......在大多数技术(例如Java EE)中,此类应用程序非常常见,并且作为起点非常有用。
如果它可以用于基准测试,甚至更好。
如果它使用一个(或多个)Hadoop,Cassandra,HBase,MongoDB,Hive,Redis,它会很棒。
谢谢!
答案 0 :(得分:2)
您可以使用TeraSort,这是与Hadoop一起打包的基准测试。它对数TB的数据进行排序,并用于对新的Hadoop集群进行压力测试。它是Hadoop安装附带的hadoop-x.y.z-examples.jar
文件的一部分。
要使用它,请使用Teragen将数据生成到HDFS,然后运行Terasort。