解析具有未知数据格式的文件

时间:2015-03-22 12:37:01

标签: json parsing serialization format

我必须解析一个文件,但我不确定这个文件有哪种数据格式。我也不知道它是专有协议还是常用的,所以我在这之前就开始为它编写解析器。下面是该文件的摘录。

Persistent_Storage = {
    "0, 07/13/07 23:57:26, 1,20808,53, 38, Orc, Hunter, Dustwallow Marsh, , 0", -- [1]
    "0, 07/13/07 23:57:26, 1,49719,79, 30, Orc, Warlock, Orgrimmar, , 0", -- [2]
    ... more data ...
}
RoundInfo = {
    "0, 1, 13, 41", -- [1]
    "0, 2, 4, 33", -- [2]
    "0, 3, 6, 33", -- [3]
    ... more data ...
}

对于好奇:这是来自魔兽世界头像历史数据集(http://mmnet.iis.sinica.edu.tw/dl/wowah/)的游戏痕迹。

1 个答案:

答案 0 :(得分:0)

如链接网站上提供的论文所述

  

数据收集方法为了收集痕迹,我们在World of World中创建了一个角色   魔兽境界(台湾的光之希望境界)并保留   它在整个3年的研究期间在线。人物   由用 Lua 脚本编写的程序控制   语言,魔兽世界用于界面   定制。我们的程序自动收集了一份清单   每10分钟在线化身。

     

日志格式日志文件由两个阵列组成: Persistant_Storage   和 RoundInfo 。收集的所有信息都是关于   头像的历史存储在Persistant_Storage数组中。   每个元素存储关于观察到的化身的信息   在抽样期间;因此,元素的数量是相等的   在该采样间隔中在线的化身数量。   元素是一个包含11个以逗号分隔的字段的字符串。   11个字段是虚拟,查询时间,查询序列号,   头像ID,公会,级别,种族,类,区域,虚拟,虚拟。

本文没有明确说明这些是Lua数组文字,但它们与Lua table constructor语法匹配。