汉字字符串搜索算法

时间:2010-03-24 10:46:49

标签: python unicode cjk string-search

Python代码可用于普通的字符串搜索算法,例如Boyer-Moore。我希望在中文字符上使用它,但看起来似乎没有相同的实现。为了使算法适用于汉字,我该怎么办?我是指这个:

http://en.literateprograms.org/Boyer-Moore_string_search_algorithm_(Python)#References

1 个答案:

答案 0 :(得分:3)

只要你的所有文字都是unicodes,它应该可以正常工作。该算法看起来与序列无关,前提是每个“元素”长度为一个序列单元。