我查看了开发者指南,但未找到答案。到目前为止,我能够将HDFS中的CSV和ORC文件加载到Vora,但是能够从Hive加载吗?
如果没有将Hive指定为源,我尝试使用等于/ apps / hive / warehouse / tablename / 00000_0的“路径”(或者是部分文件名)。但是,如果Hive表由/ tablename /目录中的多个文件表示,我必须在“路径”中明确列出它们,这不是一个理想的选择。还有更好的办法吗?
更新:这个问题的上下文是,虽然Vora不提供数据持久性,但我想将Hive仓库用作持久层,这最终仍然是文件,但有一些额外的组织。在SAP生态系统中使用Hadoop,我可以利用带有Hive适配器的SAP Data Services将文件从外部加载到Hadoop中(如果需要,可以将数据从Hadoop转储到文件中),并通过Vora提供这些数据。
答案 0 :(得分:1)
没有自动方法将Hive表加载/迁移到Vora中。在HDFS中基于(Hive-organized)文件创建Vora表将是最佳选择。
paths
选项允许使用通配符*
从HDFS中的特定目录加载所有文件。这适用于csv,镶木地板,兽人。例如。 paths "/path_to_my_dir1/*,/path_to_my_dir2/*"