我正在进行一些日志文件解析,目的是通过Web应用程序访问结果。我想在我的数据库中创建一个速度优化(用于Select
查询)数据结构,但也不会太大(文件大小;我使用SQLite)。
输入
日志的简化示例:
timedate, num1, num2, text_value
2014-05-06 18:00, 2, 1, alpha
2014-05-07 06:00, 2, 0, alpha, gamma
2014-05-07 12:00, 2, 5, gamma
2014-05-07 18:00, 2, 4, beta
注意:我没有& t&无法了解text_value的所有可能值!
注意2:尽管不太可能,但在初始运行后,可能必须解析/添加任何给定日期的新日志行。
输出
我可以很好地处理数值数据 - 我将其聚合起来,所以我在数据库中最终得到这样的表:
date, num1, num2 text_value (type = array (I know there's no such type))
2014-05-06, 2, 1 [alpha*1]
2014-05-07, 6, 9 [alpha*1], [gamma*2], [beta*1]
但我如何处理字符串?我不能算数,因为我不知道所有可能的价值。
修改
显然,上述输出在text_value的数据库中不起作用。我需要存储text_value中每次出现的字符串的数量,那么我该如何存储呢?
任何人都可以建议我应该使用哪种表格结构用于非求和数据。我有什么选择?
由于