apache-spark - Spark中的磁盘读取速度差异 - Thinbug

Spark中的磁盘读取速度差异

时间：2016-01-14 13:10:19

标签： apache-spark hive hdfs

我正在测试使用Spark加载存储在HDFS中的表需要多长时间（我正在使用JavaHiveContext）。

我的桌子是22,4Gb，分为215块，所以当我读到它时，我得到了215个任务。

从结果中，每个任务以42Mb /秒的速度读取（每个任务读取107Mb，为2,54秒）（在我的测试中，我使用1个执行器和一个核心），但在我的主机上，磁盘速度不低于100Mb /秒。

为什么我会出现这种差异？

0 个答案:

没有答案