从文本文件创建嵌套字典

时间:2018-09-25 14:39:49

标签: python

/tmp/bond0:

Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)

Bonding Mode: IEEE 802.3ad Dynamic link aggregation
Transmit Hash Policy: layer2+3 (2)
MII Status: up
MII Polling Interval (ms): 100
Up Delay (ms): 0
Down Delay (ms): 0

802.3ad info
LACP rate: slow
Min links: 0
Aggregator selection policy (ad_select): stable
Active Aggregator Info:
Aggregator ID: 2
Number of ports: 2
Actor Key: 11
Partner Key: 705
Partner Mac Address: 02:1c:73:9c:3c:fe

Slave Interface: p1p1
MII Status: up
Speed: 10000 Mbps
Duplex: full
Link Failure Count: 0
Permanent HW addr: 9c:dc:71:45:eb:80
Aggregator ID: 2
Slave queue ID: 0

Slave Interface: p4p1
MII Status: up
Speed: 10000 Mbps
Duplex: full
Link Failure Count: 0
Permanent HW addr: 9c:dc:71:4d:80:20
Aggregator ID: 2
Slave queue ID: 0

我具有上面的文本输出,并且我想创建一个嵌套的字典,如下所示: 在上面的文本中,可能有两个以上的从属接口块

bond0 : {
 'MII Status:' : 'up',
 'Aggregator ID:' : '2',
 'Slave Interfaces' : { 'p1p1' : { 'MII Status' : 'up',
 'Permanent HW addr' : '9c:dc:71:45:eb:80',
 'MII Status' : up },
 'p4p1' : { ''MII Status' : 'up',
 'Permanent HW addr' : '9c:dc:71:4d:80:20',
 'MII Status' : up },
 },

我开始进行如下所示的编码,但仍未到达那里:    #/ usr / bin / python

来自未来导入print_function    导入pprint    导入操作系统    汇入    导入子进程

class BndClass(dict):
   def __init__(self, Bnd=None):
      self['Name'] = Bnd
      self.uPdateInfo()
      super(BndClass, self).__init__()

   def uPdateInfo(self):
      OutBnd = subprocess.Popen(['cat', '/tmp/'\
    + self['Name']],shell=False,stdout=subprocess.PIPE,stderr=subprocess.PIPE)
      for line in OutBnd.stdout:
          match = re.search(r'^Cur.*?:\s+(.*?)$', line)
          if match:
              self['act_int'] = match.group(1)

          match = re.search(r'^\s*?Aggregator ID:\s+(\d)$', line)
          if match:
              self['agid'] = match.group(1)

          match = re.search(r'^Slave\sInterface:\s(.*?)$', line)
          if match:
              self.setdefault('slvs', []).append(match.group(1))


  if __name__ == '__main__':
      Y = BndClass('bond0')

  Y:

  {'Name': 'bond0', 'agid': '2', 'slvs': ['p1p1', 'p4p1']}

我可能还有更多的“ bond”文件,例如bond1,2,3,4,依此类推..所以我认为开设课程更有意义,然后我转换为课程形式。但是它失败了。有什么想法吗?

#!/usr/bin/python
from __future__ import print_function
from collections import defaultdict
import pprint
import os
import re
import subprocess



class BndClass(dict):
    def __init__(self, Bnd=None):
        self['Name'] = Bnd
        self.uPdateInfo()
        super(BndClass, self).__init__()

    def uPdateInfo(self):
        with open(self['Name'], "r") as f:
            for line in f:
                line = line.strip()  # clean that up a bit :)
                if line.strip() == "": continue
                match = re.search(r'^\s*?(Aggregator ID):\s+(\d)$', line)
                if match:
                    self[match.group(1)] = match.group(2)
                    continue

                match = re.search(r'^(Slave\sInterface):\s(.*?)$', line)
                if match:
                    self[match.group(1)] = match.group(2)
                    while True:
                        try:
                            line = next(f).strip()
                        except:
                            break
                        if line == "":
                            break
                        slave_match = re.search(r'^(MII\sStatus):\s+(\w+)$', line)
                        if slave_match:
                            self.setdefault(match.group(1), {}).setdefault(match.group(2), {})[slave_match.group(1)] = slave_match.group(2)
                            continue
                        slave_match = re.search(r'^(Permanent\sHW\saddr):\s+(.+)$', line)
                        if slave_match:
                            self.setdefault(match.group(1), {}).setdefault(match.group(2), {})[slave_match.group(1)] = slave_match.group(2)
                            continue

if __name__ == '__main__':
   B = BndClass('bond0')

Traceback (most recent call last):
File "./bc6.py", line 47, in <module>
    B = BndClass('bond0')
 File "./bc6.py", line 14, in __init__
   self.uPdateInfo()
 File "./bc6.py", line 39, in uPdateInfo
   self.setdefault(match.group(1), {}).setdefault(match.group(2), {}) 
 [slave_match.group(1)] = slave_match.group(2)
 AttributeError: 'str' object has no attribute 'setdefault'

2 个答案:

答案 0 :(得分:1)

对不起,我开始了,然后我做了其他事情却忘记了...

这是一个解决方案,它不是最性感的,但仍在起作用。如果文件的格式非常严格(看起来如此),则可以使用breakcontinue语句来提高效率,避免无用的正则表达式搜索。

import re
from collections import defaultdict

final_dict = defaultdict(lambda: defaultdict(str))

with open("bound0_file.txt", "r") as f:
    for line in f:
        line = line.strip()  # clean that up a bit :)
        if line.strip() == "": continue
        match = re.search(r'^\s*?(Aggregator ID):\s+(\d)$', line)
        if match:
            final_dict[match.group(1)] = match.group(2)
            continue

        match = re.search(r'^(Slave\sInterface):\s(.*?)$', line)
        if match:
            final_dict[match.group(1)][match.group(2)] = {}
            while True:
                try:
                    line = next(f).strip()
                except:
                    break
                if line == "":
                    break
                slave_match = re.search(r'^(MII\sStatus):\s+(\w+)$', line)
                if slave_match:
                    final_dict[match.group(1)][match.group(2)][slave_match.group(1)] = slave_match.group(2)
                    continue
                slave_match = re.search(r'^(Permanent\sHW\saddr):\s+(.+)$', line)
                if slave_match:
                    final_dict[match.group(1)][match.group(2)][slave_match.group(1)] = slave_match.group(2)
                    continue

    print(final_dict)

from collections import defaultdict
final_dict = defaultdict(lambda: defaultdict(str))

这里我们使用defaultdict,它允许我们“根据要求创建密钥”,基本上,如果您搜索不存在的密钥,defaultdict会创建它而不是引发错误。 / p>

我要嵌套其中两个,因为我真正想要的是第二个,并且因为您最多具有两个级别。

...
match = re.search(r'^\s*?(Aggregator ID):\s+(\d)$', line)
if match:
        final_dict[match.group(1)] = match.group(2)
        continue

如果我的行是 aggregator id ,那么我在final_dict中输入了这一行。 注意添加的组“ aggregator id)。然后,因为我知道这行已经完成,所以我使用了continue语句跳过了循环的其余部分,然后继续进行下一个线。

...
match = re.search(r'^(Slave\sInterface):\s(.*?)$', line)
if match:
    final_dict[match.group(1)][match.group(2)] = {}

在这里开始棘手的部分。如果前一个match失败了(又名 aggregator id ,而不是行),那么我们尝试一下,如果不是从属接口,我们就在下一行循环。

但是,如果这是一行,则意味着我们输入一个从属接口块,该块以空行结束(稍后再介绍)。

这行final_dict是我不得不使用defaultdict的原因,因为我将立即创建嵌套的字典Slave interface: { 'p1p1': {} }

        ...
        while True:
            try:
                line = next(f).strip()
            except:
                break

我们输入一个“子循环”,我正在使用它通过从属接口块查找所需的条目( MII状态永久硬件地址)。我们将在此子循环(如下)中做一些事情,但是当我们找到空行时,这意味着我们已经完成了当前块。 (如果到达文件末尾,则try-expect语句用于break)。

            ...
            if slave_match:
                final_dict[match.group(1)][match.group(2)][slave_match.group(1)] = slave_match.group(2)
                continue
            slave_match = re.search(r'^(Permanent\sHW\saddr):\s+(.+)$', line)
            if slave_match:
                final_dict[match.group(1)][match.group(2)][slave_match.group(1)] = slave_match.group(2)
                continue

这与第一个match完全相同,我们寻找右行并将其添加到final_dict中。但是,我们需要使用另一个变量,因为我们需要match来访问字典中的正确位置。


您可以看到自己离自己很近。这种方法可能不是最好的方法。

答案 1 :(得分:0)

我想出了以下解决方案,该解决方案可以满足我的要求。谢谢

import re
import pprint
from collections import defaultdict

class AclassOfItwsOwn():
    def __init__(self, bond):
    self.bond = bond


def doIt(self):
    return self.MakeDict(self.bond)

@staticmethod
def MakeDict(bond):
    final_dict = defaultdict(lambda: defaultdict(str))

    with open(bond + '.txt', "r") as f:
        for line in f:
            line = line.strip()
            if line.strip() == "":
                continue
            match = re.search(r'^\s*?(Aggregator ID):\s+(\d)$', line)
            if match:
                final_dict[match.group(1)] = match.group(2)
                continue

            match = re.search(r'^(Slave\sInterface):\s(.*?)$', line)
            if match:
                final_dict[match.group(1)][match.group(2)] = {}
                while True:
                    try:
                        line = next(f).strip()
                    except:
                        break
                    if line == "":
                        break
                    slave_match = re.search(r'^(MII\sStatus):\s+(\w+)$', line)
                    if slave_match:
                        final_dict[match.group(1)][match.group(2)][slave_match.group(1)] = slave_match.group(2)
                        continue
                    slave_match = re.search(r'^(Permanent\sHW\saddr):\s+(.+)$', line)
                    if slave_match:
                        final_dict[match.group(1)][match.group(2)][slave_match.group(1)] = slave_match.group(2)
                        continue
    return final_dict

b0 = AclassOfItwsOwn('bond0')
b0.doIt()
b2 = AclassOfItwsOwn('bond2')
b2.doIt()