在python中使用多个定界符进行解析

时间:2019-07-09 19:30:33

标签: python parsing delimiter

我有一个数据文件,其中的数据以逗号,制表符和换行符分隔符存储,像这样

[32135,    311351,    88686
123152,    3153131,    131513
....]

我想从中提取一个nx3数组 我该怎么办?

尝试在拆分行中使用split,但是它只是部分解析了文件

import numpy as np
filename="Elem_Output.inp"
f = open(filename,"r")
pmax=f.read()
p1=pmax.split()

我希望提取一个数组,其中每一行一行,数组的每一列中的数字

1 个答案:

答案 0 :(得分:0)

在pmax = f.read()之后,您可能需要编写:

#Replace tab and newline as comma separater
pmax = pmax.replace("\n",",").replace("\t", ",")

#Replace repeated delimiter by a single instance
pmax = pmax.replace(",,,",",").replace(",,",",")

不用说,使用正则表达式(import re)可以更好地进行编码。

第二,如果您的文件以方括号开头和结尾,则可能需要另外添加:

pmax = pmax.replace("[","").replace("]","")

现在,如果您希望将此输出作为数组而不是列表,请尝试以下操作:

from array import array
array_pmax = array("B", pmax)

array()函数中的第一个参数指示类型代码。要了解更多,只需使用help(array)

希望有帮助!