PHP:由于多个相似的名称而导致array_diff计数问题

时间:2014-03-24 12:04:12

标签: php arrays array-difference

如何匹配array_diff中的相似单词

单个字的多个名称的问题,如电视电视,英寸英寸,移动电话,移动电话......因此在array_diff计数中创建错误的百分比

示例:

    $str1 = "Samsung Television 21 Inches LED BH005DE";
    $str2 = "Samsung 21 Inch LED TV";

    $arr1 = explode(' ', $str1);
    $arr2 = explode(' ', $str2);

    $differenceCount = count(array_diff($arr2, $arr1));

上面的str1和str2包含电视,电视英寸,英寸字样。如何解决这个问题

1 个答案:

答案 0 :(得分:2)

最明显的方法是使用同义词:

$str1 = "Samsung Television 21 Inches LED BH005DE";
$str2 = "Samsung 21 Inch LED TV";

//synonyms:
$syns = [
   'TV'   => ['TV', 'Television'],
   'Inch' => ['Inch', 'Inches']
];

//replace:
$str1 = array_reduce(array_keys($syns), function($c, $x) use ($syns)
{
   return $c = preg_replace('/\b'.join('\b|\b', $syns[$x]).'\b/', $x, $c);
}, $str1);
//now, str1 looks like "Samsung TV 21 Inch LED BH005DE"

$str2 = array_reduce(array_keys($syns), function($c, $x) use ($syns)
{
   return $c = preg_replace('/\b'.join('\b|\b', $syns[$x]).'\b/', $x, $c);
}, $str2);
//now, str2 looks like "Samsung 21 Inch LED TV"

$arr1 = explode(' ', $str1);
$arr2 = explode(' ', $str2);


//var_dump(array_diff($arr1, $arr2));//['BH005DE']

在您的情况下,您不能依赖某种单词形式(例如Inch - Inches) - 因为您也需要解析缩写 - 这些是具有特定含义的情况。因此,使用同义词可能是解决所有案件问题的唯一方法。