Python以相同的表示方式处理两个字符串

时间:2017-12-13 14:20:59

标签: python string unicode encoding web-scraping

我怀疑它是编码的东西。

所以我有一个像这样的字符串

pattern = ((\s{1}sc\s*?((\\ud83d\\udc7b|»|→|~|@|:|;|-|=|\|)(\\ud83d\\udc7b)\s*)?[A-Za-z0-9]+)|(sc(»|→|~|@|:|;|-|=|\|)\s*[A-Za-z0-9]+)) p = re.compile(pattern, flags=re.IGNORECASE) username = re.search(p, text) unicode字符是emojis。

该字符串直接从Instagram生物中删除。我正在使用此正则表达式从bio

中提取用户名
EditText

上面的代码可以使用在代码中声明的字符串,但是当我使用看起来完全相同但从网站上删除的字符串时,它返回None。

有没有人知道我应该对被删除的字符串做什么与我声明的字符串相同,还是在编译模式时需要添加一些不同的标志?

0 个答案:

没有答案