我正在阅读Kite SDK的文档。我无法理解风筝数据集和Hive表之间的区别
例如,如果要在Hive中创建产品数据集,可以使用此URI。
dataset:hive:products
这是否意味着,使用hive cli我们可以访问同一个表products
答案 0 :(得分:0)
Kite SDK创建的数据集与通过hive cli查看的表之间没有区别。之所以如此,是因为当您使用Kite SDK在Hive中创建数据集时,您正在创建的是Hive中的表。混淆在于术语。风筝文档称为数据集的内容在Hive中称为表。
来自Kite SDK页面,名为"数据集,视图和存储库URI" (http://kitesdk.org/docs/1.1.0/URIs.html),用于将数据导入Hive表的URI格式如下。
dataset:hive:<namespace>/<dataset>
<namespace>
等同于数据库名称。请注意,如果留空,Kite将采用默认数据库。
<dataset>
等同于表名。
等效命令:
从OS终端:
#./kite-dataset show tv_shows/sitcoms
来自hive&gt;终端:
hive> select * from tv_show.sitcoms;