从密钥/计数器文本文件创建python表

时间:2015-01-27 23:26:41

标签: python parsing text-files

文本文件示例

<counter name="abcb">70324360</counter>
<counter name="efghij">1094</counter>
<counter name="klm">0</counter>

我想创建一个函数,当我调用计数器名称(efghij)时,它将返回计数器编号(1094)。我实际上并不知道从哪个文本文件开始。

2 个答案:

答案 0 :(得分:2)

您可以使用 xml 模块,该模块对您的文件结构非常关闭:

s = '''
<counter name="abcb">70324360</counter>
<counter name="efghij">1094</counter>
<counter name="klm">0</counter>'''

import xml.etree.ElementTree as ET

tree = ET.fromstring('<root>' + s + '</root>')

def get_counter(name):
    for node in tree.iter('counter'):
        if node.attrib.get('name') == name:
            return node.text

用法:

get_counter('klm')

'0'

如果您正在从文件中读取源代码,只需更改为此内容并使用<root>节点进行换行:

with open('your_file.txt', 'r') as f:
    s = f.read()

tree = ET.fromstring('<root>' + s + '</root>')
...

作为旁注 fromstring()如果没有 root 节点,则会失败,您可以简单地在解析之前将其包装。

答案 1 :(得分:0)

您可以创建dict来保存计数器,而不是功能。阅读文本文件(在本例中为'file.txt')并使用re从每行中提取数据。

import re

counter = {}
re_counter = re.compile(r'name="(\w+)">(\d+)')
for line in open('file.txt'):
    match = re_counter.search(line)
    if match:
        counter[match.group(1)] = match.group(2)
print counter["efghij"]