有没有办法在HDFS中创建逻辑/虚拟数据存储?
说我想为产品创建Catagory。因此,如果我在产品上查询hadoop,则不会针对特定的HDFS进行产品分类。
所以我想根据catagories进行查询。
答案 0 :(得分:0)
使用Hive。它觉得你可以通过Hive实现这一点,它会更方便。 Hive在运行的Hadoop集群之上提供了仓储功能。为特定产品创建数据库,并将与该产品相关的所有数据存储到此DB的表中。不仅如此,Hive还为我们提供了一个类似SQL的界面来存储在这个仓库中的数据,这使我们能够通过编写简单的查询直接查询感兴趣的数据,而无需编写复杂的MR作业或冗长的程序。
HTH