python正则表达式读取文本文件的部分

时间:2018-05-28 13:19:02

标签: python regex

我的.txt文件看起来像

'type': 'validation', 'epoch': 91, 'loss': tensor(294.8862,      device='cuda:0'), 'acc': tensor(1.00000e-02 *
   9.9481), 'kl': tensor(292.5818, device='cuda:0'), 'likelihood': tensor(-2.3026, device='cuda:0')}{'type': 'train', 'epoch': 92, 'loss': tensor(51.1491, device='cuda:0'), 'acc': tensor(1.00000e-02 *
   9.9642), 'kl': tensor(48.8444, device='cuda:0'), 'likelihood': tensor(-2.3026, device='cuda:0')}

我想宣读acc来绘制它。我的代码在这里出了什么问题?

    acc = list(map(lambda x: x.split(" ")[-1], re.findall(r"(acc: \d.\d+)", file)))

    print(re.findall(r"(acc: \d.\d+)", file))

    train = acc[0::3]
    valid = acc[1::3]
    return np.array(train).astype(np.float32), np.array(valid).astype(np.float32)

感谢您的帮助!

2 个答案:

答案 0 :(得分:0)

如果您需要acc的值,请尝试。

import re

acc = []
with open(filename, "r") as infile:
    acc = re.findall(r"'acc':\s+tensor\((.*?)\)", infile.read())
print(acc)

<强>输出:

['1.00000e-02 *9.9481', '1.00000e-02 *9.9642']

或者如果您只需要使用浮动值。

acc = [float(i.split("*")[-1].strip()) for i in acc]
print(acc) # -->[9.9481, 9.9642]

答案 1 :(得分:0)

你的正则表达式错了......

在您查找'acc'时,文件为acc: 同样在'acc':之间,数值为tensor( ... )

尝试:     ('acc': tensor\(.+?\))