如何匹配array_diff中的相似单词
单个字的多个名称的问题,如电视电视,英寸英寸,移动电话,移动电话......因此在array_diff计数中创建错误的百分比
示例:
$str1 = "Samsung Television 21 Inches LED BH005DE";
$str2 = "Samsung 21 Inch LED TV";
$arr1 = explode(' ', $str1);
$arr2 = explode(' ', $str2);
$differenceCount = count(array_diff($arr2, $arr1));
上面的str1和str2包含电视,电视和英寸,英寸字样。如何解决这个问题
答案 0 :(得分:2)
最明显的方法是使用同义词:
$str1 = "Samsung Television 21 Inches LED BH005DE";
$str2 = "Samsung 21 Inch LED TV";
//synonyms:
$syns = [
'TV' => ['TV', 'Television'],
'Inch' => ['Inch', 'Inches']
];
//replace:
$str1 = array_reduce(array_keys($syns), function($c, $x) use ($syns)
{
return $c = preg_replace('/\b'.join('\b|\b', $syns[$x]).'\b/', $x, $c);
}, $str1);
//now, str1 looks like "Samsung TV 21 Inch LED BH005DE"
$str2 = array_reduce(array_keys($syns), function($c, $x) use ($syns)
{
return $c = preg_replace('/\b'.join('\b|\b', $syns[$x]).'\b/', $x, $c);
}, $str2);
//now, str2 looks like "Samsung 21 Inch LED TV"
$arr1 = explode(' ', $str1);
$arr2 = explode(' ', $str2);
//var_dump(array_diff($arr1, $arr2));//['BH005DE']
在您的情况下,您不能依赖某种单词形式(例如Inch
- Inches
) - 因为您也需要解析缩写 - 这些是具有特定含义的情况。因此,使用同义词可能是解决所有案件问题的唯一方法。