我为3个不同的网站编写了抓取工具,并在3个主题中运行抓取工具。对于每个爬虫,我使用单个记录器。 我的log4j.properties'文件看起来像:
log4j.rootLogger=TRACE, ZDNET, CNET, GOOGLEPLAY
log4j.appender.ZDNET=org.apache.log4j.RollingFileAppender
log4j.appender.ZDNET.File=logs/zdnet.log
log4j.appender.ZDNET.MaxFileSize=20MB
log4j.appender.ZDNET.MaxBackupIndex=100
log4j.appender.ZDNET.layout=org.apache.log4j.PatternLayout
log4j.appender.ZDNET.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss} %-5p - %m%n
log4j.appender.CNET=org.apache.log4j.RollingFileAppender
log4j.appender.CNET.File=logs/cnet.log
log4j.appender.CNET.MaxFileSize=20MB
log4j.appender.CNET.MaxBackupIndex=100
log4j.appender.CNET.layout=org.apache.log4j.PatternLayout
log4j.appender.CNET.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss} %-5p - %m%n
log4j.appender.GOOGLEPLAY=org.apache.log4j.RollingFileAppender
log4j.appender.GOOGLEPLAY.File=logs/googlePlay.log
log4j.appender.GOOGLEPLAY.MaxFileSize=20MB
log4j.appender.GOOGLEPLAY.MaxBackupIndex=100
log4j.appender.GOOGLEPLAY.layout=org.apache.log4j.PatternLayout
log4j.appender.GOOGLEPLAY.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss} %-5p - %m%n
log4j.category.zdNetLogger=DEBUG, ZDNET
log4j.additivity.zdNetLogger=false
log4j.category.cNetLogger=DEBUG, CNET
log4j.additivity.cNetLogger=false
log4j.category.googlePlayLogger=DEBUG, GOOGLEPLAY
log4j.additivity.googlePlayLogger=false
在java中,我使用以下代码编写我的日志
final Logger APK_LOG = Logger.getLogger("googlePlayLogger");
final Logger C_NET_LOG = Logger.getLogger("cNetLogger");
final Logger ZD_NET_LOG = Logger.getLogger("zdNetLogger");
....
ZD_NET_LOG.info("1");
C_NET_LOG.info("2");
APK_LOG.info("3");
一切正常,直到我开始使用Selenium + HtmlUnit + HtmlUnitDriver。 之后,当我运行我的程序时,3个日志文件(zdnet.log,cnet.log,googlePlay.log)由来自HtmlUnitDriver的日志填充。 之后记录我的文件信息(zdnet.log,cnet.log,googlePlay.log):
2015-06-16 02:47:08 DEBUG - Get page for window named '', using WebRequest[<url="about:blank", GET, EncodingType[name=application/x-www-form-urlencoded], [], {Accept=image/gif, image/jpeg, image/pjpeg, image/pjpeg, */*, Accept-Encoding=gzip, deflate}, null>]
2015-06-16 02:47:08 DEBUG - setEnclosedPage: HtmlPage(about:blank)@945834833
2015-06-16 02:47:08 DEBUG - destroyChildren
2015-06-16 02:47:08 DEBUG - Encoding found in HTTP headers: 'UTF-8'.
2015-06-16 02:47:08 DEBUG - Mapping java.lang.Object to HTMLCollection
2015-06-16 02:47:08 DEBUG - Mapping com.gargoylesoftware.htmlunit.html.HtmlSpan to HTMLSpanElement
任何想法为什么会发生?
答案 0 :(得分:0)
因为HttpClient和HtmlUnit都使用log4j来编写日志。
您的rootLogger
定义trace
级别,因此它会写入所有内容。
请添加以下内容,仅允许HttpClient和HtmlUnit发送error
级消息。
log4j.logger.com.gargoylesoftware.htmlunit=error
log4j.logger.org.apache.http=error