Dedupe库如何构造它的settings.xml文件?

时间:2019-02-13 10:42:34

标签: python hash python-dedupe

我想了解重复数据删除库实际上是如何将其设置为settings.xml文件的,尤其是它为谓词规则提供分数的部分,以及如何反转SETTINGS.xml文件中的哈希或了解分数根据用户所提供的主动学习,为谓词规则提供

示例Settings.xml:

S'(wholeFieldPredicate, gn)'
p252
sg21
g22
sg23
S'gn'
p253
sbasg23
g253
sg228
S'(gn: Exact)'
p254
sg230
I00
sbag0
(g8
g2
Ntp255
Rp256
(dp257
g12
(lp258
g0
(g14
g2
Ntp259
Rp260
(dp261
g18
I-2618985129409613916
sg19

0 个答案:

没有答案