Flume将输出格式从.csv更改为.json

时间:2012-08-19 13:59:00

标签: java logging hadoop flume hadoop-plugins

我在其仅节点(测试)模式下使用水槽; 我的水槽以下列方式开始:

flume node -1 -c $ FQDN':amqp(“exchangeName = [exchange name]”,“bindings = [binding name]”,“host = 127.0.0.1”,“port = 5672”,“userName = [user]“,”password = [pass]“,”exchangeType = direct“,”durableExchange = false“,”queueName = [queue name]“,”durableQueue = true“,”exclusiveQueue = false“,”autoDeleteQueue = false “,”useMessageTimestamp = true“)| collectorSink(”s3n:// [亚马逊密钥]:[亚马逊密码] @ [S3路径]“,”服务器“);' -s“$ @”> “$ log”2>& 1

我有兴趣通过水槽传递.csv文件。 不幸的是,flume将.csv文件转换为.json,添加了一些字段。

示例:

原来的消息:

"a,b,c"

flume将消息转换为:

{"body":"\""a,b,c\"","timestamp":1345380385605,"pri":"INFO","nanos":275832626718182,"host":[host name],"fields":{"rolltag":"20120819-124542793+0000.275789814494811.00000011"}}

如何配置flume按原样传递消息?

1 个答案:

答案 0 :(得分:1)

你可以解析json并提取'body'标签。