python whatsapp chat删除无效令牌

时间:2016-04-10 10:33:56

标签: python whatsapp

我想分析一下WhatsApp聊天记录。 我把文字拆分成了单词。但我有一个问题,即有许多不必要的单词(我猜这些是emojis)。 有谁知道如何检查一个单词在Python中是否有效? (这意味着该单词至少包含一个字母字符)

1 个答案:

答案 0 :(得分:0)

这里的困难在于正确定义构成有效单词的内容。当需要考虑多种语言时,这可能是任意复杂的。

如果你只想检查这个单词是否包含至少一个Ascii字符,你可以这样做:

def is_valid_word(word):
  return any([letter in string.ascii_letters for letter in word])