在Apache Flume上使用TAILDIR源时,我可以设置目录模式吗?

时间:2018-01-12 01:48:29

标签: flume

我使用flume-1.8.0。 在文档上,它说我无法设置目录模式。 (正则表达式(而不是文件系统模式)只能用于文件名。) 但是我必须设置目录模式以从其他团队控制的其他系统获取日志。 是否有一些设置目录路径的解决方案,如/dir/201801/0101.log,/dir/201802/0001.log, ...?

1 个答案:

答案 0 :(得分:0)

对具有文件模式的文件组使用类似这样的内容,即使用正则表达式ASCII模式,请参阅https://en.wikipedia.org/wiki/Regular_expression以获取更多详细信息

a1.sources.r1.filegroups.f2 = /dir/[0-9]{6}/[0-9]{4}.log

在你的情况下,我会建议

Container killed by YARN for exceeding memory limits. 24 GB of 22 GB physical memory used. Consider boosting spark.yarn.executor.memoryOverhead.