使用Athena从Cloudfront日志中检测位置,浏览器和设备类型

时间:2018-08-24 05:27:55

标签: amazon-web-services logging amazon-cloudfront amazon-athena

可以提供有关Athena日志的任何帮助,并能够提取有用的信息。

1 个答案:

答案 0 :(得分:0)

来自Querying Amazon CloudFront Logs - Amazon Athena

  

您可以配置Amazon CloudFront CDN将Web分发访问日志导出到Amazon S3。使用这些日志来探索用户在CloudFront服务的您的整个网络媒体资源中的浏览模式。

您可以使用以下方法创建表:

CREATE EXTERNAL TABLE IF NOT EXISTS default.cloudfront_logs (
  `date` DATE,
  time STRING,
  location STRING,
  bytes BIGINT,
  requestip STRING,
  method STRING,
  host STRING,
  uri STRING,
  status INT,
  referrer STRING,
  useragent STRING,
  querystring STRING,
  cookie STRING,
  resulttype STRING,
  requestid STRING,
  hostheader STRING,
  requestprotocol STRING,
  requestbytes BIGINT,
  timetaken FLOAT,
  xforwardedfor STRING,
  sslprotocol STRING,
  sslcipher STRING,
  responseresulttype STRING,
  httpversion STRING,
  filestatus STRING,
  encryptedfields INT
)
ROW FORMAT DELIMITED 
FIELDS TERMINATED BY '\t'
LOCATION 's3://CloudFront_bucket_name/AWSLogs/Account_ID/'
TBLPROPERTIES ( 'skip.header.line.count'='2' )

useragent字段标识请求的来源,例如提交请求的设备和浏览器的类型,以及(如果请求来自搜索引擎,则是哪个搜索引擎)。

location字段仅标识访问内容时使用了哪个 Amazon CloudFront边缘位置

为了获得更好的位置指示,您可以使用IP Geo Lookup Service从IP地址获取位置。

请参阅:Amazon CloudFront log file format