我有一个包含多行的大文件,如下所示。我想只读取那些包含_INIT模式的行,然后从名称中删除_INIT,只将OSD_MODE_15_H部分保存在变量中。然后我需要读取相应的十六进制值,在这种情况下为8'h00,并从中剥离8'h并将其替换为0x并保存在变量中。 我一直在尝试剥离_INIT,空格和=并且代码变得非常混乱。
localparam OSD_MODE_15_H_ADDR = 16'h038d;
localparam OSD_MODE_15_H_INIT = 8'h00
你能建议一种精简而干净的方法吗?
谢谢!
答案 0 :(得分:2)
以下解决方案使用正则表达式(编译为加速搜索)以匹配相关行并提取所需信息。该表达式使用命名组“id”和“hexValue”来标识我们要从匹配行中提取的数据。
import re
expression = "(?P<id>\w+?)_INIT\s*?=.*?'h(?P<hexValue>[0-9a-fA-F]*)"
regex = re.compile(expression)
def getIdAndValueFromInitLine(line):
mm = regex.search(line)
if mm == None:
return None # Not the ..._INIT parameter or line was empty or other mismatch happened
else:
return (mm.groupdict()["id"], "0x" + mm.groupdict()["hexValue"])
编辑:如果我正确理解了下一个任务,你需要找到ID匹配的那些INIT和ADDR行的十六进制值,并为ADDR十六进制值创建INIT十六进制值的字典。
regex = "(?P<init_id>\w+?)_INIT\s*?=.*?'h(?P<initValue>[0-9a-fA-F]*)"
init_dict = {}
for x in re.findall(regex, lines):
init_dict[x.groupdict()["init_id"]] = "0x" + x.groupdict()["initValue"]
regex = "(?P<addr_id>\w+?)_ADDR\s*?=.*?'h(?P<addrValue>[0-9a-fA-F]*)"
addr_dict = {}
for y in re.findall(regex, lines):
addr_dict[y.groupdict()["addr_id"]] = "0x" + y.groupdict()["addrValue"]
init_to_addr_hexvalue_dict = {init_dict[x] : addr_dict[x] for x in init_dict.keys() if x in addr_dict}
即使这不是您真正需要的,使用init和addr词典可能有助于更轻松地实现目标。如果有多个具有相同ID和不同十六进制值的_INIT(或_ADDR)行,则上述dict方法将无法正常工作。
答案 1 :(得分:1)
尝试这样的事情 - 不确定你的所有要求是什么,但这应该让你接近:
with open(someFile, 'r') as infile:
for line in infile:
if '_INIT' in line:
apostropheIndex = line.find("'h")
clean_hex = '0x' + line[apostropheIndex + 2:]
在“16'h038d;”的情况下,clean_hex将为“0x038d;” (需要以某种方式删除“;”)并且在“8'h00”的情况下,clean_hex将为“0x00”
编辑:如果你想防范像“;”这样的字符你可以这样做并测试一个字符是否是字母数字:
clean_hex = '0x' + ''.join([s for s in line[apostropheIndex + 2:] if s.isalnum()])
答案 2 :(得分:1)
您可以使用正则表达式和re.findall()
函数。例如,要生成包含您想要的数据的元组列表:
import re
lines = open("your_file").read()
regex = "([\w]+?)_INIT\s*=\s*\d+'h([\da-fA-F]*)"
res = [(x[0], "0x"+x[1]) for x in re.findall(regex, lines)]
print res
正则表达式非常适合您的输入示例。如果文件中的其他行略有不同,您可能需要稍微更改一下。