我试图使用PMML获得两个场之间的Levenshtein距离。这是否容易实现?
我看过这个:
http://dmg.org/pmml/v4-2-1/Transformations.html
但我不清楚我是否可以用它来计算Levenshtein距离以及这可能适合我的pmml文件。
答案 0 :(得分:0)
没有“独立”函数来计算两个字符串值之间的Levenshtein距离。
如果要执行字符串比较,则应查看TextIndex转换。 TextIndex
元素具有maxLevenshteinDistance
属性,可用于实现查询,例如“如果允许的最大Levenshtein距离为X,则字符串值A等于字符串值B”。
<TextIndex textField="myStringField" localTermWeights="binary" maxLevenshteinDistance="3">
<Constant dataType="string">Hello World!</Constant>
</TextIndex>
如果输入字符串值1
距离参考字符串值myStringField
少于三次编辑(否则为Hello String
),则上述内容应返回0
。