我使用简单的打印命令转储了多个defaultdict,如下所示:
defaultdict(<type 'list'>, {'actual': [20000.0, 19484.0, 19420.0], 'gold': [20000.0, 19484.0, 19464.0]})
我可以用一些标准的解析器来检索它们吗?我知道我应该使用pickle,但生成这些defaultdict的代码非常慢,我想避免重新运行它。
答案 0 :(得分:6)
如果defaultdict的类型始终为<type 'list'>
,则可以使用以下内容:
from collections import defaultdict
s = """
defaultdict(<type 'list'>, {'actual': [20000.0, 19484.0, 19420.0], 'gold': [20000.0, 19484.0, 19464.0]})
"""
data = eval(s.replace("<type 'list'>", 'list'))
人们会告诉你eval()
是不安全和邪恶的,但是如果有人试图将有害代码注入您转储的数据中,他们可能就像编辑源代码一样容易。如果您从中获取此数据的文本文件比源代码更易于访问,那么您可能不想使用此方法。
如果默认分区有多种类型,但它们都是内置类型(或者很容易在repr
和类型名称之间进行转换),那么您仍然可以将此方法用于多个替换,例如:
for rep, typ in ((repr(list), 'list'), (repr(dict), 'dict')):
s = s.replace(rep, typ)
data = eval(s)
答案 1 :(得分:2)
完全丑陋,但有效:
s = """
defaultdict(<type 'list'>, {'actual': [20000.0, 19484.0, 19420.0], 'gold': [20000.0, 19484.0, 19464.0]})
"""
import re, ast
s = re.sub('^[^{]+', '', s)
s = re.sub('[^}]+$', '', s)
print ast.literal_eval(s)
请注意,这会创建一个普通的dict
,而不是一个默认的。
答案 2 :(得分:0)
您可以创建自己的子类:
from collections import defaultdict
class mydefdict(defaultdict):
def __repr__(self):
return "mydefdict(%s, %s)" % (repr(self.default_factory()) + ".__class__", repr(dict(self)))
然后像eval
的其他类型一样使用它:
>>> d = mydefdict(list)
>>> d['foo'] = [1,2,3]
>>> d['bar']
[]
>>> print d
mydefdict([].__class__, {'foo': [1, 2, 3], 'bar': []})
>>> reprstring = repr(d)
>>> d2 = eval(reprstring)
>>> d2
mydefdict([].__class__, {'foo': [1, 2, 3], 'bar': []})
请注意,使用这种方式,将为结构中的每个对象引用创建单独的副本,即使某些对象引用是对同一对象的引用。