在Python中比较字符串:字符串X是ASCII,字符串Y是UTF

时间:2011-04-03 13:39:12

标签: python unicode utf-8 ascii string-comparison

我有一个相当奇怪的问题: 如何比较字符串(使用Python),其中字符串X是ASCII,字符串Y是UTF还是Unicode?

目前,当我比较字符串时,我收到以下问题:

UnicodeWarning: Unicode equal comparison failed to convert both arguments to Unicode - interpreting them as being unequal
  filteredtext = [t for t in s if t.lower() not in stopwords]

如何确保字符串格式相同?

最诚挚的问候。

1 个答案:

答案 0 :(得分:6)

使用基础编码转换所有字符串并进行比较:

print unicode(s1, 'ascii') == unicode(s1, 'utf-8')