如何预测用户输入的模式?

时间:2013-12-18 14:58:54

标签: language-agnostic prediction

我正在开发软件,用户可以从任意字符串中选择多个子字符串。有时,这自然会导致模式。 E.g:

"The quick brown fox jumps over the lazy dog"
 - substring selected: brown fox
"The quick purple fox jumps over the lazy dog"
 - substring selected: purple fox
"The quick orange fox jumps over the lazy dog"
 - substring selected: orange fox

所以看起来用户总是选择字符“fox”和紧接其前面的单词。

如果我能实现一些可以为这些子串提供“预测”的子程序,用户可以使用或者适当地丢弃,那将是非常巧妙的。 E.g:

"The quick yellow fox jumps over the lazy dog"
 - suggested substring: yellow fox (ACCEPTED)
"The quick red fox jumps over the lazy dog"
 - suggested substring: red fox (ACCEPTED)
"The English Foxhound is a scent hound, bred to hunt foxes by scent."
 - suggested substring: hunt fox (REJECTED)

一般来说,如何以编程方式识别用户输入中的模式,并使用这些模式对未来输入进行预测?

1 个答案:

答案 0 :(得分:1)

在文本编辑领域已经对此进行了研究。在那里,我们的想法是让用户编辑一个半结构化的文本,并将更改复制到文本的相似部分(使用适当的转换)。

一般的想法是生成候选模式,并根据用户输入和启发式对它们进行排名/解除。

请参阅示例this paper以获得精彩的概述。