应用错误收集

Confluent HDFS Sink Connector：如何配置自定义hadoop用户和组？

时间：2018-04-16 20:46:04

标签： hadoop hdfs apache-kafka-connect confluent

我们目前在docker容器中使用Confluent HDFS Sink Connector平台将数据从Kafka（单独的Kafka集群）写入HDFS（单独的Hadoop集群）。默认情况下，连接器平台使用 root 用户和 wheel 组将数据写入HDFS。如何配置连接器以使用特定的hadoop用户/组？我需要在docker中设置一个环境变量吗？感谢。

1 个答案:

答案 0 :(得分：0)

Docker容器中的Java进程以root身份运行。

您需要使用自己的用户帐户创建自己的容器，或者以其他方式将Connect Workers作为不同的Unix帐户运行。

您可以尝试设置HADOOP_IDENT_USER或HADOOP_USER_NAME环境变量，但我认为这些只是由Hadoop脚本提取，而不是Java API

请注意，如果您不使用Kerberized群集，Hadoop中的用户帐户并不重要

Kafka-HDFS-Connector-从Kafka向Hadoop发送数据
Confluent HDFS Sink Connector：如何配置自定义hadoop用户和组？
如何在Kafka接收器JDBC连接器
监视HDFS接收器连接器延迟
HDFS接收器连接器：无方案的文件系统：http
使用kafka connect hdfs接收器连接器将avro消息存储到hdfs目录时的时差
kafka连接HDFS接收器连接器失败
Kafka连接HDFS Sink连接器错误
汇合的InfluxDB接收器连接器
HDFS Sink连接器故障排除分布式模式

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？