我有一个德语单词列表,我想删除所有名词因此我照看第一个字母是大写或小写。这适用于所有单词,除了以变音符号开头的单词,例如"Äpfel"
。
# -*- coding: utf-8 -*-
dictionary = open('dictionary/de.dict', 'r')
for line in dictionary:
if line[0] == "Ä": # This does not work
print "Ä found"
我该如何做到这一点?
答案 0 :(得分:2)
utf8编码的字符串"Ä"
由两个字符组成:
>>> "Ä"
'\xc3\x84'
unicode字符串u"Ä"
只有一个。
您必须正确编码字符串。因此,如果你的字典是用utf-8编码的话:
import io
dictionary = io.open('dictionary/de.dict', encoding='utf8')
for line in dictionary:
if line[0].isupper():
print "Uppercase word", line