比较Python中的德语变音符号

时间:2014-11-23 15:14:29

标签: python

我有一个德语单词列表,我想删除所有名词因此我照看第一个字母是大写或小写。这适用于所有单词,除了以变音符号开头的单词,例如"Äpfel"

# -*- coding: utf-8 -*-
dictionary = open('dictionary/de.dict', 'r')

for line in dictionary:
    if line[0] == "Ä": # This does not work
        print "Ä found"

我该如何做到这一点?

1 个答案:

答案 0 :(得分:2)

utf8编码的字符串"Ä"由两个字符组成:

>>> "Ä"
'\xc3\x84'

unicode字符串u"Ä"只有一个。 您必须正确编码字符串。因此,如果你的字典是用utf-8编码的话:

import io
dictionary = io.open('dictionary/de.dict', encoding='utf8')
for line in dictionary:
    if line[0].isupper():
        print "Uppercase word", line