是否可以将Clickhouse数据存储配置为hdfs

时间:2018-10-20 14:33:07

标签: hadoop hdfs clickhouse

当前,clickhouse将数据存储在

  

/ var / lib / clickhouse

路径,我读过它不支持深度存储。 顺便说一句,它在config.xml文件中是否有任何用于hdfs设置的配置?

2 个答案:

答案 0 :(得分:1)

将Clickhouse数据目录存储到HDFS中,这确实是个坏主意;)

由于HDFS与posix不兼容的文件系统,在这种部署方式下,clickhouse的运行速度会非常慢

您可以使用https://github.com/jaykelin/clickhouse-hdfs-loader将HDFS中的数据加载到Clickhouse中,不久的将来https://clickhouse.yandex/docs/en/roadmap/ Clickhouse将支持PARQUET格式来加载数据

clickhouse拥有自己的高可用性和集群解决方案 请阅读 https://clickhouse.yandex/docs/en/operations/table_engines/replication/https://clickhouse.yandex/docs/en/operations/table_engines/distributed/

答案 1 :(得分:1)

HDFS引擎允许通过ClickHouse管理HDFS上的数据,从而与Apache Hadoop生态系统集成。该引擎类似于文件和URL引擎,但是提供了特定于Hadoop的功能。

https://clickhouse.yandex/docs/ru/operations/table_engines/hdfs/