Question

我使用了许多类似json的词组。 pprint对于构建它们非常方便。有没有办法使pprint输出中的所有整数以十六进制而不是十进制打印？

例如，而不是：

{66: 'far',
 99: 'Bottles of the beer on the wall',
 '12': 4277009102,
 'boo': 21,
 'pprint': [16, 32, 48, 64, 80, 96, 112, 128]}

我宁愿看：

{0x42: 'far',
 0x63: 'Bottles of the beer on the wall',
 '12': 0xFEEDFACE,
 'boo': 0x15,
 'pprint': [0x10, 0x20, 0x30, 0x40, 0x50, 0x60, 0x70, 0x80]}

我已经尝试过自定义PrettyPrinter，但无济于事，我能够导致上述情况，PrettyPrinter.format()处理整数似乎只适用于某些整数：

class MyPrettyPrinter(PrettyPrinter):
    def format(self, object, context, maxlevels, level):
        if isinstance(object, int):
            return '0x{:X}'.format(object), True, False
        return super().format(object, context, maxlevels, level)

以上课程产生

{0x42: 'far',
 0x63: 'Bottles of the beer on the wall',
 '12': 0xFEEDFACE,
 'boo': 0x15,
 'pprint': [16, 32, 48, 64, 80, 96, 112, 128]}

列表内容格式不正确。

Answer 1

你可以改变pprint的输出，但你需要重新实现saferepr() function，而不仅仅是pprint.PrettyPrinter()类的子类。

saferepr()函数（内部版本）用于所有对象，然后该函数本身递归处理将对象转换为表示（仅使用自身，而不是PrettyPrinter()实例），所以任何自定义都发生那里。只有当saferepr()的结果变得太大（对于配置的宽度来说太宽）时，PrettyPrinter类才会开始将容器输出分解成组件以放在单独的行上;然后对组件元素重复调用saferepr()的过程。

所以PrettyPrinter.format()只负责处理顶级对象，并且每个递归对象都是a）支持的容器类型（dict，list，tuple，string和这些的标准库子类）和b）.format()生成的父容器的表示超出了显示宽度。

为了能够覆盖实现，我们需要了解.format()方法和saferepr()实现如何交互，它们采用什么参数以及它们需要返回什么。

PrettyPrinter.format()传递了其他参数，context，maxlevels和level：

context用于检测递归（如果_recursion(object)为真，则默认实现返回id(object) in context的结果。
设置maxlevels且level >= maxlevels为真时，默认实现返回...作为容器的内容。

该方法也应该返回3个值的元组;表示字符串和两个标志。您可以安全地忽略这些标志的含义，它们实际上从未在当前实现中使用。它们用于表示所产生的表示是否可读“是否可读”。（使用可以传递给eval()的Python语法）或者是递归的（对象包含循环引用）。但PrettyPrinter.isreadable()和PrettyPrinter.isrecursive()方法实际上完全绕过了.format();这些返回值似乎是重构的一个障碍，它破坏了.format()与这两种方法之间的关系。所以只需返回一个表示字符串，然后任意两个你想要的布尔值。

.format()真的只是代表saferepr()的内部实现，然后做了几件事

使用context处理递归检测，并对maxlevels和level进行深度处理
递归字典，列表和元组（及其子类，只要它们的__repr__方法仍然是默认实现）
对于词典，对键值对进行排序。这是trickier than it appears in Python 3，但这是通过自定义_safe_tuple排序键来解决的，该键近似于Python 2的排序所有行为。我们可以重复使用它。

为了实现递归替换，我更喜欢使用@functools.singledispatch()来委派不同类型的处理。忽略自定义__repr__方法，处理深度问题，递归和空对象，也可以由装饰器处理：

import pprint
from pprint import PrettyPrinter
from functools import singledispatch, wraps
from typing import get_type_hints

def common_container_checks(f):
    type_ = get_type_hints(f)['object']
    base_impl = type_.__repr__
    empty_repr = repr(type_())   # {}, [], ()
    too_deep_repr = f'{empty_repr[0]}...{empty_repr[-1]}'  # {...}, [...], (...)
    @wraps(f)
    def wrapper(object, context, maxlevels, level):
        if type(object).__repr__ is not base_impl:  # subclassed repr
            return repr(object)
        if not object:                              # empty, short-circuit
            return empty_repr
        if maxlevels and level >= maxlevels:        # exceeding the max depth
            return too_deep_repr
        oid = id(object)
        if oid in context:                          # self-reference
            return pprint._recursion(object)
        context[oid] = 1
        result = f(object, context, maxlevels, level)
        del context[oid]
        return result
    return wrapper

@singledispatch
def saferepr(object, context, maxlevels, level):
    return repr(object)

@saferepr.register(int)
def _handle_int(object: int, *args):
    # uppercase hexadecimal representation with 0x prefix
    return f'0x{object:X}'

@saferepr.register(dict)
@common_container_checks
def _handle_dict(object: dict, context, maxlevels, level):
    level += 1
    contents = [
        f'{saferepr(k, context, maxlevels, level)}: '
        f'{saferepr(v, context, maxlevels, level)}'
        for k, v in sorted(object.items(), key=pprint._safe_tuple)
    ]
    return f'{{{", ".join(contents)}}}'

@saferepr.register(list)
@common_container_checks
def _handle_list(object: list, context, maxlevels, level):
    level += 1
    contents = [
        f'{saferepr(v, context, maxlevels, level)}'
        for v in object
    ]
    return f'[{", ".join(contents)}]'

@saferepr.register(tuple)
@common_container_checks
def _handle_tuple(object: tuple, context, maxlevels, level):
    level += 1
    if len(object) == 1:
        return f'({saferepr(object[0], context, maxlevels, level)},)'
    contents = [
        f'{saferepr(v, context, maxlevels, level)}'
        for v in object
    ]
    return f'({", ".join(contents)})'

class HexIntPrettyPrinter(PrettyPrinter):
    def format(self, *args):
        # it doesn't matter what the boolean values are here
        return saferepr(*args), True, False

这个hand-full可以处理基本pprint实现的任何内容，和它将在任何支持的容器中生成十六进制整数。只需创建HexIntPrettyPrinter()类的实例，然后在其上调用.pprint()：

>>> sample = {66: 'far',
...  99: 'Bottles of the beer on the wall',
...  '12': 4277009102,
...  'boo': 21,
...  'pprint': [16, 32, 48, 64, 80, 96, 112, 128]}
>>> pprinter = HexIntPrettyPrinter()
>>> pprinter.pprint(sample)
{0x42: 'far',
 0x63: 'Bottles of the beer on the wall',
 '12': 0xFEEDFACE,
 'boo': 0x15,
 'pprint': [0x10, 0x20, 0x30, 0x40, 0x50, 0x60, 0x70, 0x80]}

旁注：从Python 3.7开始，您可以删除(<type>)装饰器的@saferepr.registation(<type>)调用部分;而是从注释中选取类型。

Answer 2

哇，听起来真的很复杂。我能问问做这样的事情有什么问题吗？

d = pprint.pformat(data)
print re.sub(r'(\b\d+)L', lambda x: "0x{:x}".format(int(x.group(1))), d)

它适用于我的数据，公认的是所有long而不是int（提供了方便的L锚点），并且没有引用文字数字的情况-但是这样可以轻松应对

re.split(r"('[^']+')", d)

我会承认这不是一个很好的解决方案，但是考虑到替代方案，至少它也不复杂。

{'funcStartRanges': [],
 'noCodeRanges': [],
 'noOwnerRanges': [{'last': 0x140ce1332, 'length': 0x12, 'start': 0x140ce1321},
                   {'last': 0x140ce1332, 'length': 0x12, 'start': 0x140ce1321}],
 'otherOwnerRanges': [{'last': 0x140ce1332,
                       'length': 0x12,
                       'start': 0x140ce1321}],
 'weOwnItRanges': []}

pprint与十六进制数字

2 个答案: