我使用flume-1.8.0。 在文档上,它说我无法设置目录模式。 (正则表达式(而不是文件系统模式)只能用于文件名。) 但是我必须设置目录模式以从其他团队控制的其他系统获取日志。 是否有一些设置目录路径的解决方案,如/dir/201801/0101.log,/dir/201802/0001.log, ...?
答案 0 :(得分:0)
对具有文件模式的文件组使用类似这样的内容,即使用正则表达式ASCII模式,请参阅https://en.wikipedia.org/wiki/Regular_expression以获取更多详细信息
a1.sources.r1.filegroups.f2 = /dir/[0-9]{6}/[0-9]{4}.log
在你的情况下,我会建议
Container killed by YARN for exceeding memory limits. 24 GB of 22 GB physical memory used. Consider boosting spark.yarn.executor.memoryOverhead.