使用特定数据格式创建numpy数组

时间:2013-09-14 01:27:54

标签: python numpy

我有一个文本文件,其中包含如下日志:

245     (click,view,view,check,view,view)         (22,1,5,6,7,15)

305     (view,run)       (5,6)

3051         (run,run)      (115,36)

它是制表符分隔,第二列字段中的条目数等于第三列字段。

我发现使用np.loadtxt很难将其带入python,因为它有一个分隔符和文本和括号(圆形)来分隔第二个字段和第三个字段。

期待有关我应该怎么做的建议?

1 个答案:

答案 0 :(得分:2)

在加载到numpy之前,最好先用标准python以某种方式解析它?如果不知道numpy需要如何格式化,下面就是一个将它变成数组数组的例子。

例如,您可以使用split()

Def MakeItAList(lineFromFile):     list = split(lineFromFile,“”)     list [1] = split(list [1] [1:-1],“,”)     list [2] = split(list [2] [1:-1],“,”)

它有点笨重,但会变成245 (click,view,view,check,view,view) (22,1,5,6,7,15)。像[245, [click,view,view,check,view,view], [22,1,5,6,7,15]]这样的东西,作为一种数据结构更容易管理。