Question

我有一个文本文件，其中包含如下日志：

245     (click,view,view,check,view,view)         (22,1,5,6,7,15)

305     (view,run)       (5,6)

3051         (run,run)      (115,36)

它是制表符分隔，第二列字段中的条目数等于第三列字段。

我发现使用np.loadtxt很难将其带入python，因为它有一个分隔符和文本和括号（圆形）来分隔第二个字段和第三个字段。

期待有关我应该怎么做的建议？

Answer 1

在加载到numpy之前，最好先用标准python以某种方式解析它？如果不知道numpy需要如何格式化，下面就是一个将它变成数组数组的例子。

例如，您可以使用split()。

Def MakeItAList（lineFromFile）： list = split（lineFromFile，“”） list [1] = split（list [1] [1：-1]，“，”） list [2] = split（list [2] [1：-1]，“，”）

它有点笨重，但会变成245 (click,view,view,check,view,view) (22,1,5,6,7,15)。像[245, [click,view,view,check,view,view], [22,1,5,6,7,15]]这样的东西，作为一种数据结构更容易管理。