在Hadoop中,我可以轻松创建Map / Reduce应用程序,这些应用程序可访问和处理大型文本文件和csv文件中的数据。我的问题是Hbase可以做同样的事情并访问如此庞大的文件,还是HBase有其他用途?
Hbase运行查询就像关系数据库一样;所以,我很难理解HBase的优势,除非它可以像Hadoop一样访问大文本和csv文件。
答案 0 :(得分:1)
首先,Hbase只是一家商店。商店永远不会访问任何东西。而是访问商店以获取或放置数据。与任何其他数据存储区一样,Hbase只有一项工作要做,存储您的数据并在您需要时随时可用。您可以编写MapReduce作业或顺序Java程序等,将数据放入Hbase或从中获取数据。这完全取决于你喜欢哪条道路。
来到问题的第二部分,Hbase永远不会像传统的关系数据库那样工作。从存储数据到访问数据,一切都完全不同。使用Hbase的优点是,您可以将非常大量的数据存储到其中并具有随机读/写访问权限。数据可以是任何类型即。文本,csv,tsv,二进制等等。但是,在继续之前,你必须好好考虑一下Hbase是否适合你,因为一个尺寸并不适合你。
HTH