Word Proximity Redux。
我想创建一个可以扫描一大块文本(任意长度)的PHP脚本, 并寻找指定/定义的术语。
然后我想测量那些出现之间的距离(如果有的话)。
距物理距离 - 出现之间的单词/字符数。 (我不是指拼写/听起来/字符数等等 - 只是单独的项目数量。)
实施例: 要查找的具体术语= Word1 Word2 扫描的具体文字= Blah blah Word1 blah blah Word2 blah。 结果将是= Word1-Word2:+2距离
(我真的希望我能够比第一次尝试更清楚地解释这一点)
我已经四处寻找,看过谷歌/这里/其他论坛等等 - 我没有看到任何匹配的内容,这就是我在这里发帖的原因。
以上是最基本的欲望,因为最终我希望能够扫描并查看是否出现在相同的上下文块中(例如段落,同一标题下方或单独的一个等) )。 因此,最终目标可能是根据单词和语义块的实际距离对其进行评分。