如何设置JSONEncoder产生的浮点数?

时间:2019-01-25 17:40:43

标签: python json python-3.x floating-point

我正在尝试将python json库设置为将包含其他字典作为元素的字典保存到文件中。浮点数很多,我想将位数限制为例如7。

应使用SO encoder.FLOAT_REPR中的其他帖子。但是它不起作用。

例如下面的代码在Python3.7.1中运行,将打印所有数字:

import json
json.encoder.FLOAT_REPR = lambda o: format(o, '.7f' )
d = dict()
d['val'] = 5.78686876876089075543
d['name'] = 'kjbkjbkj'
f = open('test.json', 'w')
json.dump(d, f, indent=4)
f.close()

我该如何解决?

可能无关紧要,但我在OSX上。

编辑

此问题被标记为重复。但是在the accepted answer (and until now the only one) to the original post中明确指出:

  

注意:此解决方案不适用于python 3.6 +

因此该解决方案不是正确的解决方案。另外,它正在使用库simplejson 不是json

4 个答案:

答案 0 :(得分:2)

选项1:使用正则表达式匹配进行舍入。

您可以使用json.dumps将对象转储为字符串,然后使用this post上显示的技术来查找并舍入浮点数。

为了进行测试,我在您提供的示例之上添加了一些更复杂的嵌套结构:

d = dict()
d['val'] = 5.78686876876089075543
d['name'] = 'kjbkjbkj'
d["mylist"] = [1.23456789, 12, 1.23, {"foo": "a", "bar": 9.87654321}]
d["mydict"] = {"bar": "b", "foo": 1.92837465}

# dump the object to a string
d_string = json.dumps(d, indent=4)

# find numbers with 8 or more digits after the decimal point
pat = re.compile(r"\d+\.\d{8,}")
def mround(match):
    return "{:.7f}".format(float(match.group()))

# write the modified string to a file
with open('test.json', 'w') as f:
    f.write(re.sub(pat, mround, d_string))

输出test.json如下:

{
    "val": 5.7868688,
    "name": "kjbkjbkj",
    "mylist": [
        1.2345679,
        12,
        1.23,
        {
            "foo": "a",
            "bar": 9.8765432
        }
    ],
    "mydict": {
        "bar": "b",
        "foo": 1.9283747
    }
}

此方法的一个局限性是它还将匹配双引号内的数字(以字符串表示的浮点数)。您可以根据自己的需要提出一个限制性更强的正则表达式来处理此问题。

选项2:子类json.JSONEncoder

以下内容将适用于您的示例并处理您将遇到的大多数极端情况:

import json

class MyCustomEncoder(json.JSONEncoder):
    def iterencode(self, obj):
        if isinstance(obj, float):
            yield format(obj, '.7f')
        elif isinstance(obj, dict):
            last_index = len(obj) - 1
            yield '{'
            i = 0
            for key, value in obj.items():
                yield '"' + key + '": '
                for chunk in MyCustomEncoder.iterencode(self, value):
                    yield chunk
                if i != last_index:
                    yield ", "
                i+=1
            yield '}'
        elif isinstance(obj, list):
            last_index = len(obj) - 1
            yield "["
            for i, o in enumerate(obj):
                for chunk in MyCustomEncoder.iterencode(self, o):
                    yield chunk
                if i != last_index: 
                    yield ", "
            yield "]"
        else:
            for chunk in json.JSONEncoder.iterencode(self, obj):
                yield chunk

现在使用自定义编码器写入文件。

with open('test.json', 'w') as f:
    json.dump(d, f, cls = MyCustomEncoder)

输出文件test.json

{"val": 5.7868688, "name": "kjbkjbkj", "mylist": [1.2345679, 12, 1.2300000, {"foo": "a", "bar": 9.8765432}], "mydict": {"bar": "b", "foo": 1.9283747}}

为了使诸如indent之类的其他关键字参数起作用,最简单的方法是读取刚刚写入的文件,然后使用默认编码器将其写回:

# write d using custom encoder
with open('test.json', 'w') as f:
    json.dump(d, f, cls = MyCustomEncoder)

# load output into new_d
with open('test.json', 'r') as f:
    new_d = json.load(f)

# write new_d out using default encoder
with open('test.json', 'w') as f:
    json.dump(new_d, f, indent=4)

现在输出文件与选项1所示相同。

答案 1 :(得分:1)

根据我对问题的回答,您可能可以使用以下这些内容:

Write two-dimensional list to JSON file

我说可能,因为它要求在使用dump()进行JSON编码之前,先“包装” Python字典(或列表)中的所有浮点值。

(已通过Python 3.7.2测试。)

from _ctypes import PyObj_FromPtr
import json
import re


class FloatWrapper(object):
    """ Float value wrapper. """
    def __init__(self, value):
        self.value = value


class MyEncoder(json.JSONEncoder):
    FORMAT_SPEC = '@@{}@@'
    regex = re.compile(FORMAT_SPEC.format(r'(\d+)'))  # regex: r'@@(\d+)@@'

    def default(self, obj):
        return (self.FORMAT_SPEC.format(id(obj)) if isinstance(obj, FloatWrapper)
                else super(MyEncoder, self).default(obj))

    def iterencode(self, obj, **kwargs):
        for encoded in super(MyEncoder, self).iterencode(obj, **kwargs):
            # Check for marked-up float values (FloatWrapper instances).
            match = self.regex.search(encoded)
            if match:  # Get FloatWrapper instance.
                id = int(match.group(1))
                float_wrapper = PyObj_FromPtr(id)
                json_obj_repr = '%.7f' % float_wrapper.value  # Create alt repr.
                encoded = encoded.replace(
                            '"{}"'.format(self.FORMAT_SPEC.format(id)), json_obj_repr)
            yield encoded


d = dict()
d['val'] = FloatWrapper(5.78686876876089075543)  # Must wrap float values.
d['name'] = 'kjbkjbkj'

with open('float_test.json', 'w') as file:
    json.dump(d, file, cls=MyEncoder, indent=4)

创建的文件内容:

{
    "val": 5.7868688,
    "name": "kjbkjbkj"
}

更新

正如我提到的,以上要求在调用float之前包装所有json.dump()值。幸运的是,可以通过添加和使用以下(经过最低测试的)实用程序来自动执行此操作:

def wrap_type(obj, kind, wrapper):
    """ Recursively wrap instances of type kind in dictionary and list
        objects.
    """
    if isinstance(obj, dict):
        new_dict = {}
        for key, value in obj.items():
            if not isinstance(value, (dict, list)):
                new_dict[key] = wrapper(value) if isinstance(value, kind) else value
            else:
                new_dict[key] = wrap_type(value, kind, wrapper)
        return new_dict

    elif isinstance(obj, list):
        new_list = []
        for value in obj:
            if not isinstance(value, (dict, list)):
                new_list.append(wrapper(value) if isinstance(value, kind) else value)
            else:
                new_list.append(wrap_type(value, kind, wrapper))
        return new_list

    else:
        return obj


d = dict()
d['val'] = 5.78686876876089075543
d['name'] = 'kjbkjbkj'

with open('float_test.json', 'w') as file:
    json.dump(wrap_type(d, float, FloatWrapper), file, cls=MyEncoder, indent=4)

答案 2 :(得分:0)

没有回答这个问题,但是对于解码方面,您可以执行类似的操作,或者重写hook方法。

要使用此方法解决此问题,虽然需要先编码,解码,然后再编码,但这种方法过于复杂,不再是最佳选择。我以为Encode拥有Decode所做的一切,我的错。

# d = dict()
class Round7FloatEncoder(json.JSONEncoder): 
    def iterencode(self, obj): 
        if isinstance(obj, float): 
            yield format(obj, '.7f')


with open('test.json', 'w') as f:
    json.dump(d, f, cls=Round7FloatEncoder)

答案 3 :(得分:-1)

您可以使用字符串格式功能将数字转换为仅具有7个小数点的字符串。然后将其转换回这样的浮点数:

float("{:.7f}".format(5.78686876876089075543))

字符串中的方括号告诉格式化程序它必须遵守内部规则。

冒号开始格式化规则。

7告诉格式化程序,人在小数点后的位置。

f表示格式化浮点数。

然后将您的号码传递给格式函数,该函数返回:'5.7868688' 然后可以将其传递回float函数,以使浮动返回。

在此处查找有关python中的格式化函数的更多信息:https://pyformat.info/