为什么unicode to string只能用于try / except?

时间:2015-09-06 13:56:42

标签: string python-2.7 unicode try-except

就在我认为我的头脑被unicode转换为字符串时,Python 2.7引发异常。

下面的代码循环遍历许多重音字符,并将它们转换为非重音字符。我为双s提出了一个特例。

#!/usr/bin/python
# -*- coding: utf-8 -*-
import unicodedata

def unicodeToString(uni):
  return unicodedata.normalize("NFD", uni).encode("ascii", "ignore")

accentList = [
#(grave accent)
u"à",
u"è",
u"ì",
u"ò",
u"ù",
u"À",
u"È",
u"Ì",
u"Ò",
u"Ù",

#(acute accent)
u"á",
u"é",
u"í",
u"ó",
u"ú",
u"ý",
u"Á",
u"É",
u"Í",
u"Ó",
u"Ú",
u"Ý",

#(arrete accent) 
u"â",
u"ê",
u"î",
u"ô",
u"û",
u"Â",
u"Ê",
u"Î",
u"Ô",
u"Û",

#(tilde )
u"ã",
u"ñ",
u"õ",
u"Ã",
u"Ñ",
u"Õ",

#(diaresses)
u"ä",
u"ë",
u"ï",
u"ö",
u"ü",
u"ÿ",
u"Ä",
u"Ë",
u"Ï",
u"Ö",
u"Ü",
u"Ÿ",

#ring 
u"å",
u"Å",

#ae ligature
u"æ",
u"Æ", 

#oe ligature
u"œ",
u"Œ",

#c cidilla
u"ç",
u"Ç",

# D stroke?
u"ð",
u"Ð",

# o slash
u"ø",
u"Ø",

u"¿", # Spanish ?
u"¡", # Spanish !
u"ß"  # Double s
]

for i in range(0, len(accentList)):
  try:
    u = accentList[i]
    s = unicodeToString(u)
    if u == u"ß":
      s = "ss"
    print("%s -> %s" % (u, s))
  except:
    pass

没有try / except我收到错误:

File "C:\Python27\lib\encodings\cp437.py", line 12, in encode
    return codecs.charmap_encode(input,errors,encoding_map)
UnicodeEncodeError: 'charmap' codec can't encode character u'\xc0' in  position 0
: character maps to <undefined>

我可以做些什么来使代码运行而不使用try / except?我正在使用Sublime Text 2。

1 个答案:

答案 0 :(得分:1)

try/except不会使Unicode工作。它只是隐藏错误。

要解决{{1}}错误,请放弃{{1}}并查看Python, Unicode, and the Windows console