Kite SDK数据集和Hive表之间的区别

时间:2015-08-29 08:19:40

标签: hadoop hive cloudera sqoop sqoop2

我正在阅读Kite SDK的文档。我无法理解风筝数据集和Hive表之间的区别

例如,如果要在Hive中创建产品数据集,可以使用此URI。

dataset:hive:products

这是否意味着,使用hive cli我们可以访问同一个表products

1 个答案:

答案 0 :(得分:0)

Kite SDK创建的数据集与通过hive cli查看的表之间没有区别。之所以如此,是因为当您使用Kite SDK在Hive中创建数据集时,您正在创建的是Hive中的表。混淆在于术语。风筝文档称为数据集的内容在Hive中称为表。

来自Kite SDK页面,名为"数据集,视图和存储库URI" (http://kitesdk.org/docs/1.1.0/URIs.html),用于将数据导入Hive表的URI格式如下。

dataset:hive:<namespace>/<dataset>

<namespace>等同于数据库名称。请注意,如果留空,Kite将采用默认数据库。

<dataset>等同于表名。

等效命令:

从OS终端:

#./kite-dataset show tv_shows/sitcoms

来自hive&gt;终端:

hive> select * from tv_show.sitcoms;