解析Weblog(Omniture)数据--Adobe Analytics

时间:2017-09-19 10:16:16

标签: database streaming adobe-analytics bigdata

我的网络搜索日志文件的Omniture数据如下(示例):

  1. 每条记录最多可包含178列
  2. 这些是'|'分隔文本文件
  3. 该数据包含421,266条记录
  4. 样本记录

      

    1331175664 | 2012-03-07 19:01:04 | 2858672213737177245 | 6917530638790887804 | FAS-2.8-AS3 | N | 0 | 65.0.176.236 | 1 | 0 || 10 | http://www.acme.com/SH55126545/VD55170364| {44491661-134A -492B-A0AC-CE28420721D3} ||||||||||||| U |的en-US || 537 | 651 | 1366 | Y | Y | Y | 2 | 2 | 304 | bellsouth.net | 7 / 2/2012 20:16:27 3 360 | 45 | 41 || Mozilla / 5.0(兼容; MSIE 9.0; Windows NT 6.1; WOW64; Trident / 5.0)| 48 | 0 | 1 | 38 | 0 |哥伦比亚| usa | 710 |毫秒| 0 | 0 | 1 | 0 0 |||||||| ||||||||||||||||| WAPT ||||| ||||| 0 |||||| 212120 |||||||||||||||||||||||| WAPT |||||||||||||||||| ||||||||||||||||||||||||||||||||| 0 |||||

    其中每个值用“|”分隔在文件中,但我找不到/理解列名称或这些记录的标题。我可以识别几个列名称,如IP地址/日期时间,但有些很难理解。

    请任何人帮助我获取每个值的列名。

    提前致谢!

0 个答案:

没有答案