当值与列表中的文件匹配时,用另一个字典替换一个字典中的项目

时间:2019-08-16 16:53:03

标签: python loops dictionary string-comparison

我目前正在尝试使用计算机上本地存在的HTML文件自动生成文档。每个HTML文档均以其描述的对象命名,我只想获取每个对象属性的名称和每个属性的数据类型,并保留某些对象之间的层次关系。

到目前为止,我有以下代码:

import os
from lxml import html


fileList = []

for folderName, subFolders, filenames in os.walk("Path/To/Relevant/Files"):
    for filename in filenames:
            fileList.append(folderName + "/" + filename)

propertyDictList = []

for i in range(0, len(fileList)):
    file = open(fileList[i])
    page = file.read()
    tree = html.fromstring(page)

    propertyNameXpath = tree.xpath("//someXpathquery")
    propertyNames = [str(i) for i in propertyNameXpath]

    propertyTypeXpath = tree.xpath("//anotherXpathquery")
    propertyTypes = [str(i) for i in propertyTypeXpath]

    propertyDict = dict(zip(propertyNames, propertyTypes))

    propertyDictList.append(propertyDict)

此代码从目录中的每个文件中获取每个属性的名称和数据类型,并将它们放入键值对中,作为字典的条目,每个文件一个字典。然后将这些词典附加到propertyDictList上。

我现在要弄清楚的是如何重新建立某些对象之间的层次关系。例如,假设我有一个描述对象“ foo”的文件。我们将文件名称为Path/To/Relevant/Files/foo.html。现在,此“ foo”对象可能具有多个属性,因此描述它的字典如下所示:

{"bar" : "string", "baz" : "int", "fizz" : "buzz"}

"buzz"数据类型实际上是指目录中存在的另一个对象,如Path/To/Relevant/Files/buzz.html中所述。我想做的是将字典的值与目录中的文件名列表进行比较,如果某些字典值与文件名列表中的项之间存在匹配,则从匹配文件中提取的字典为代替价值。例如

{"bar" : "string", "baz" : "int", "fizz" : { "baa" : "ram" , "ewe" : "fleece" }}

1 个答案:

答案 0 :(得分:2)

在当前代码中,您不存储从文件名到从文件提取的属性的映射。假设您添加了该内容,那么您正在谈论的扩展相对而言就很简单:

props_by_file = {
  "foo": {"bar" : "string", "baz" : "int", "fizz" : "buzz"},
  "buzz": { "baa" : "ram" , "ewe" : "fleece" }
}

for file_props in props_by_file.values():
  for k, v in file_props.items():
    if v in props_by_file:
      file_props[k] = props_by_file[v]

props_by_file
# {'foo': {'bar': 'string', 'baz': 'int', 'fizz': {'baa': 'ram', 'ewe': 'fleece'}},
#  'buzz':                                        {'baa': 'ram', 'ewe': 'fleece'}
# }