标签: python special-characters
使用外国字符(ģ,č,ŗ,ļ,ā,ē,ū,ī,ņ,š,ķ,ž及其首都)处理烦人的问题。它们的长度都使用len不等于1,例如len('ī')为2(处理文本时显示为\xc4\xab)。我想要一个为所有这些字符返回1的函数。有什么帮助吗?
len
len('ī')
\xc4\xab
答案 0 :(得分:0)
感谢Robᵩ的解释性网页。我问题的简明解决方案:
def varlen(string): return len(string.decode('utf-8'))