我正在开发一个免费的网站站点地图应用程序。
我想问一下在网络服务器日志文件中写入的请求网址的格式是什么?
我想解析这些日志文件,以便提取网站的各个页面。
每行格式是否总是“GET /mywebpage.html”? 谢谢!
答案 0 :(得分:0)
它并不总是相同的 - 默认值因服务器而异,并且可以配置。例如,在Apache中,您可以在配置中设置CustomLog指令,该指令允许完整自定义记录的信息,记录的顺序以及记录的文件。
答案 1 :(得分:0)
到目前为止,最常见的格式是Apache CLF(通用日志格式或组合日志格式):
LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-agent}i\"" combined
要获得更好的答案,您需要指定正在使用的网络服务器,或者至少显示一个示例日志行。