好吧,实际上我正在编写一个用于解析日文/中文文本的程序,但我尝试将其映射到英文示例。不,我不想用它来创建密码列表:)。
假设有一个没有空格的文本(大多数东亚语言中没有使用空格),如:
helloiamwritingproperenglish!
给定文本中的特定字符位置,如r
正确:
helloiamwritingproperenglish!
^
因此可以在prefix + 'r' + suffix
中分解文本。
此外,还有一个存储在SQLite中的字典,其中包含字符组合(单词),如:
sqllite>SELECT writingKey from dic_writings;
writingKey
----------
A, Aa, ...
我想找到字典中包含所选字符'r'和前缀和后缀的(可能是空的)子串的所有常规单词,如:
sqllite>FindCandidates('helloiamwritingp','r','operenglish!');
R, Pro, Rope, Prop, Proper
查询输入text
中的所有单词的查询可能是:
SELECT * FROM dic_writings WHERE (text LIKE ('%'||writingKey||'%'));
但这种方法不是很快,我需要过滤包含所选'r'的单词(检查'r'实际上是不够的)。有人有想法吗?谢谢你的时间!