Hadoop 并非旨在进行更新。我尝试使用hive
它必须执行insert overwrite,这是一项代价高昂的操作,我们也可以使用Map reduce进行一些工作,这也是一项代价高昂的操作。
他们可以使用frequent updates on Hadoop
的任何其他工具或方式,或者我可以使用spark
。请帮助我,即使在谷歌搜索100次之后我也没有得到足够的信息。提前谢谢。
答案 0 :(得分:2)
如果您需要在Hadoop上更新实时, Hbase 是您可能想要查看的解决方案,Hive不适用于随机/频繁更新,它更多的是数据处理工具而非替换RDBMS