我有一个相当奇怪的问题: 如何比较字符串(使用Python),其中字符串X是ASCII,字符串Y是UTF还是Unicode? p>
目前,当我比较字符串时,我收到以下问题:
UnicodeWarning: Unicode equal comparison failed to convert both arguments to Unicode - interpreting them as being unequal
filteredtext = [t for t in s if t.lower() not in stopwords]
如何确保字符串格式相同?
最诚挚的问候。
答案 0 :(得分:6)
使用基础编码转换所有字符串并进行比较:
print unicode(s1, 'ascii') == unicode(s1, 'utf-8')