PMML标准中是否存在Levenshtein距离?你怎么计算它?

时间:2018-03-30 16:18:24

标签: pmml

我试图使用PMML获得两个场之间的Levenshtein距离。这是否容易实现?

我看过这个:

http://dmg.org/pmml/v4-2-1/Transformations.html

但我不清楚我是否可以用它来计算Levenshtein距离以及这可能适合我的pmml文件。

1 个答案:

答案 0 :(得分:0)

没有“独立”函数来计算两个字符串值之间的Levenshtein距离。

如果要执行字符串比较,则应查看TextIndex转换。 TextIndex元素具有maxLevenshteinDistance属性,可用于实现查询,例如“如果允许的最大Levenshtein距离为X,则字符串值A等于字符串值B”。

<TextIndex textField="myStringField" localTermWeights="binary" maxLevenshteinDistance="3">
  <Constant dataType="string">Hello World!</Constant>
</TextIndex>

如果输入字符串值1距离参考字符串值myStringField少于三次编辑(否则为Hello String),则上述内容应返回0