这些天我正在经历Apache Hive,以下事情让我感到困惑 -
有一个Hive Web界面(hive --service hwi),它监听一个端口(默认为9999)并允许客户端提交查询并稍后返回设施,授权配备等。
还有一个HiveServer(hive --service HiveServer),它运行服务器并允许远程客户端连接和提交Hive查询,并且还受授权保护等。
他们有什么不同? (或他们不是)?如果它们不同,但提供相同类型的功能,有什么不同?
还有一个HiveServer2和一个Thrift服务器,不确定,但我认为比HiveServer有所改进?
有人可以谈论它们并澄清,它们中的独特性和它们解决的更大问题是什么?
此致
(* Vipul)();
答案 0 :(得分:2)
Hive的HWI(HiveWebInterface)是使用Hive命令行界面的替代方法。它提供了诸如以下的功能:
HiveServer允许远程客户端使用Thrift的various programming language绑定向Hive提交请求。由于HiveServer使用Thrift,它有时被称为ThriftServer。
HiveServer v1无法处理来自多个客户端的并发请求,此限制在HiveServer v2中得到解决,后者允许多个并发连接到客户端。 HiveServer2还提供:
HiveServer2提供了各种client interfaces之类:
HiveServer2 JDBC驱动程序可用于连接到Tableau,Talend等BI工具以执行ETL。