我是一家大型旅行社的程序员。我很有经验,但现在我遇到了一个需要建立AI的问题。我知道这些脚本到处存在,但我似乎找不到任何有用的东西。
基本上我们正在构建一个FAQ脚本。我们每天都会收到相同类型问题的电子邮件,因此我们希望建立一个联系表单,就像我写这篇文章一样:在右侧它提供了许多已经存在的问题回答的问题与我现在写的有些相似。我写这个主题时也是如此。
好吧,开始做生意。我正在制作一个联系表格,但是当客户正在写主题和/或消息时,我希望在他们写作时为他们呈现一些预先定义的Q& A。我相信我无法使用soundex
,因为常见问题解答将是丹麦语,因此听起来不像英语。
那么......我怎么样:
基本上我正在研究,所以我非常感谢只是简单的SQL查询以及为此目的而设计的完整脚本!一切都很有用。
答案 0 :(得分:1)
是否会将此作为对Zane的评论添加,但它相当长:
根据丹麦语法,你可能需要一些相当大的Levenshtein距离截止点才能找到可能的匹配。
如果你有更多的时间花在这上面,你可能想要在单词边界处分开,阻止单个单词,然后将这些词干的计数与数据库中已有的词干进行比较。在http://pecl.php.net/package/stem似乎有一个词汇库(我从未使用它,但它似乎支持丹麦语。)
因为看起来pecl-stem没有我能找到的正式文档(好吧,我很好奇),你在安装pecl包之后就这样使用了它:
$stem = stem($myInputWord, STEM_DANISH);
既然我正在仔细阅读PHP手册,我不妨在更大的应用程序中添加它(我不会为你的情况引入只是)你可能想看一下用于设置Solr等的PHP手册的Search Engine Section。但同样,你的情况可能有点过分了。
答案 1 :(得分:0)