分析英语文本句子来检测PHP中的押韵

时间:2012-04-13 00:05:28

标签: php algorithm text lexical-analysis

我不确定这是否可行,但是有没有办法(预先编写的图书馆或已知的科学检测方案)来分析几个句子的文本并确定句子是否押韵?一位同事建议比较第一个和最后一个词并使用同义词库,但我不太明白这是如何工作的。

高精度不是我的目标,甚至20%的准确度都会很棒,这是一个花哨的小网页应用程序的想法,我没有什么重要的,只是觉得它会很酷。

我愿意尝试其他语言,甚至可能是Python,我听说它非常适合分析文本,但PHP会更好。

1 个答案:

答案 0 :(得分:7)

Metaphone http://www.php.net/manual/en/function.metaphone.php

您可以将输入分类为语音(声音),然后检查是否经常出现相同的声音。由于每一个都应该与音节匹配,你可以计算Levenshtein距离(计算匹配之间的音节),看它们是否适合某种已知的模式,即。俳句。

http://www.php.net/manual/en/function.levenshtein.php

http://php.net/manual/en/function.soundex.php