Apache Impala可以在EC2(不是EMR)上安装/运行,以从S3读取数据吗?还是需要Hadoop Namenode和HDFS正常工作? 有关安装依赖项的文档不是很清楚。
答案 0 :(得分:-1)
是的,Impala可以在没有hdfs的情况下运行。 Hadoop生态系统所需的唯一组件是hive-metastore,它用于存储元数据。
关于S3的可访问性,您可以参考https://www.cloudera.com/documentation/enterprise/5-7-x/topics/impala_s3.html