搜索字符串中的英文单词

时间:2017-01-20 12:03:10

标签: python string

我正在做一个实验,我取Pi的前100,000个数字,并将偶数转换为1,将奇数转换为0。

然后我将结果(现在是二进制)转换为ascii。

现在我有一个字符串,长度超过100,000个字符,我想搜索它是否包含英文单词。

我知道增强模块,但在这种情况下不确定如何使用它。

即:

如果我的字符串看起来像"9847a89(*^&*()^#589thcsdehellosfr8e9&(*)^$f",我希望能够找到hello

1 个答案:

答案 0 :(得分:0)

> 'hello' in "9847a89(*^&*()^#589thcsdehellosfr8e9&(*)^$f"
True

> 'goodbye' in "9847a89(*^&*()^#589thcsdehellosfr8e9&(*)^$f"
False

如果你想检查每个英文单词,那么强力解决方案就是迭代,例如/usr/share/dict/words并依次尝试每一个。如果速度太快,有一个更快的算法,但你可能需要自己编写代码。