我有一个文本文件,其中包含如下日志:
245 (click,view,view,check,view,view) (22,1,5,6,7,15)
305 (view,run) (5,6)
3051 (run,run) (115,36)
它是制表符分隔,第二列字段中的条目数等于第三列字段。
我发现使用np.loadtxt很难将其带入python,因为它有一个分隔符和文本和括号(圆形)来分隔第二个字段和第三个字段。
期待有关我应该怎么做的建议?
答案 0 :(得分:2)
在加载到numpy之前,最好先用标准python以某种方式解析它?如果不知道numpy需要如何格式化,下面就是一个将它变成数组数组的例子。
例如,您可以使用split()
。
Def MakeItAList(lineFromFile): list = split(lineFromFile,“”) list [1] = split(list [1] [1:-1],“,”) list [2] = split(list [2] [1:-1],“,”)
它有点笨重,但会变成245 (click,view,view,check,view,view) (22,1,5,6,7,15)
。像[245, [click,view,view,check,view,view], [22,1,5,6,7,15]]
这样的东西,作为一种数据结构更容易管理。