运行Python 2.7
执行时:
$ python client.py get_emails -a "åäö"
我明白了:
usage: client.py get_emails [-h] [-a AREA] [-t {rfc2822,plain}]
client.py get_emails: error: argument -a/--area: invalid unicode value: '\xc3\xa5\xc3\xa4\xc3\xb6'
这是我的解析器:
def _argparse():
desc = """
Simple CLI-client for...
"""
argparser = argparse.ArgumentParser(description=desc)
subparsers = argparser.add_subparsers(dest='command')
# create the parser for the "get_emails" command
parser_get_emails = subparsers.add_parser('get_emails', help=u'Get email list')
parser_get_emails.add_argument('-a', '--area', type=unicode, help='Limit to area')
parser_get_emails.add_argument('-t', '--out_type', choices=['rfc2822', 'plain'],
default='rfc2822', help='Type of output')
args = argparser.parse_args()
return args
这是否意味着我不能在python argparse模块中使用任何unicode字符?
答案 0 :(得分:17)
你可以尝试
type=lambda s: unicode(s, 'utf8')
而不是
type=unicode
没有编码参数unicode()默认为ascii。
答案 1 :(得分:13)
命令行参数使用sys.getfilesystemencoding()
编码:
import sys
def commandline_arg(bytestring):
unicode_string = bytestring.decode(sys.getfilesystemencoding())
return unicode_string
# ...
parser_get_emails.add_argument('-a', '--area', type=commandline_arg)
注意:Python 3中不需要它(参数已经是Unicode)。在这种情况下,它使用os.fsdecode()
,因为有时命令行参数可能是不可解码的。请参阅PEP 383 -- Non-decodable Bytes in System Character Interfaces。