从字典中删除NoneTypes

时间:2013-11-12 18:23:35

标签: python for-loop dictionary beautifulsoup nonetype

在有人提到它之前,我已经遍布stackoverflow和谷歌找到答案,我相信我可能只是做错了。

我正在使用BeautifulSoup4废弃xml文档并将值放入变量中。现在我正在读取报废到字典中的值并遍历字典以查找我需要的值,但是,当我想将这些值打印到带有模板的报表中时,我收到以下错误:

TypeError: coercing to Unicode: need string or buffer, NoneType found

我发现的是将None值作为我字典中的一个值的结果。解决方案:我一直试图在python 2.7中迭代我的字典以删除或替换NoneType值,但似乎没有任何效果。我发现的一些解决方案是filter(None, list)函数,for k, v in dictionary: if v in not None: list.append(item)clean = [x for x in list if x != None],使用lambda等等。他们似乎都没有工作让我相信我一定做错了。例如,这就是我设置字典的方式:

itemDict = []

  for item in soup3.find_all('XMLTag'):
    r = {
        'definition1': item.Starttag.string,
        'definition2': item.Stoptag.string,
        'definition3': item.Filltag.string,
        'definition4': item.Stoptag2.string,

    }
    itemDict.append(r)

但是通过它来移除或替换itemDict中的NoneTypes一直很痛苦。我计划的最终结果是将字典中的项目放入一段模板代码中作为报告打印,例如"""<Description>"""+item[0]['definition4']+"""</Description>"""。有什么想法吗?

编辑:

由于Martijn Pieters和Steve Jessop,解决方案实际上非常简单。

itemDic = []

for newdic in soup3.find_all("XMLTag"):
s = {
    'definition1': newdic.Order.string,
    'definition1': newdic.Code.string,
    'definition1': newdic.Description.string,
    }

for k in s:
    if s[k] is None:
        s[k] = ''

itemDic.append(s)

这替换了使用带有空字符串的BeautifulSoup4从XML scrape中发现的所有NoneType。类似地,上面的代码也可以替换用户对给定条件所需的任何其他值。所以例如,如果我想将“神话般的”每个实例更改为“它只是好的”,我会将'None'替换为'fabulous'和空字符串,'','它只是没关系'和中提琴!再次感谢你们。

2 个答案:

答案 0 :(得分:1)

为什么不首先创建一个没有None值的字典?

tags = ('Starttag', 'Stoptag', 'Filltag', 'Stoptag2')

for item in soup3.find_all('XMLTag'):
    r = {}
    for i, tag in enumerate(tags, 1):
        value = getattr(item, tag).string
        if value is not None:
            r['definition' + str(i)] = value
    itemDict.append(r)

答案 1 :(得分:0)

r = {
    'definition1': item.Starttag.string,
    'definition2': item.Stoptag.string,
    'definition3': item.Filltag.string,
    'definition4': item.Stoptag2.string,
}

new_r = dict((k, v) for k, v in r.iteritems() if v is not None)

但是看起来好像你以后要编写new_r['definition4'],所以删除带有None条目的密钥只会将异常更改为另一个。您应该做出关于缺失数据的实际决定; - )