我熟悉像hadive,hbase,hdfs等的hadoop组件。但是我对Apache Kudu还是很陌生。
到目前为止,根据我的研究,我知道kudu只是像镶木地板那样的柱状存储。而且它比Hbase更快。
但是我仍然找不到用于kudu安装的任何有效文档。甚至我都在想我是否真的需要为kudu或在hadoop中内置它(EMR或Dataproc)安装任何单独的软件包。
请帮助我如何开始使用kudu。
答案 0 :(得分:3)
Kudu不是文件格式,而是不同的存储引擎。将其视为HDFS(或S3)的并行/替代文件系统。是的,它确实需要安装Master和Tablet服务器,请参阅Apache网站上的Architecture Overview。
由于它是Apache的开源项目,因此安装说明也可以在Apache网站https://kudu.apache.org/docs/installation.html上找到。