应用错误收集

Hadoop中日志文件的含义

时间：2014-05-20 01:18:52

标签： logging hadoop

我尝试用不同的应用程序分析Hadoop系统的工作特性，例如MapReduce，Hbase等。有一些日志文件用于不同目的，例如namenode，datanode和jobtrack。日志文件采用特定格式。有没有人知道日志文件中每个项目的确切含义？或者我可以在哪里找到相关的文档？

谢谢！

1 个答案:

答案 0 :(得分：0)

Hadoop使用log4j来处理日志。看起来你没有修改配置。我不知道你使用的是哪个版本。因此，假设您在此处使用配置：https://github.com/apache/hadoop-common/blob/ade66f948e2cf0d5bd46a212b58c8ca3c85aba39/hadoop-common-project/hadoop-common/src/main/conf/log4j.properties

输出到控制台的日志格式定义为

log4j.appender.console.layout.ConversionPattern=%d{yy/MM/dd HH:mm:ss} %p %c{2}: %m%n

％d {yy / MM / dd HH：mm：ss}：日期及其格式。
％p：日志记录事件的优先级。例如，INFO，DEBUG，ERROR。
％c：日志记录事件的类别。在Hadoop中，它通常是类名。
％m：日志消息。
％n：平台相关的行分隔符或字符。

可在此处找到更多信息：http://logging.apache.org/log4j/1.2/apidocs/org/apache/log4j/PatternLayout.html

输出示例是

14/05/19 06:50:42 INFO http.HttpServer: Jetty bound to port 42253