我在AWS EMR集群上运行Pig脚本,但没有使用Hive的经验。我试图了解如何在HDFS中运行Hive查询和脚本,因为需要有数据库和表设置。
我应该在运行Hive查询或脚本之前设置数据库和表吗? hive查询显然应该有FROM
子句,但是如何知道在FROM
子句中指定哪个表和数据库?
答案 0 :(得分:0)
您希望创建一个外部表,它以类似SQL的语法将表定义为Hive,但指向磁盘上已存在的数据。
请参阅任何Hive文档,例如https://cwiki.apache.org/confluence/display/Hive/Tutorial