我想从段落或文本内容中提取名称。我正在使用PHP。我试图从下面的库中提取名称。
https://packagist.org/packages/php-text-analysis/php-text-analysis
https://packagist.org/packages/php-text-analysis/php-text-analysis
$text = "my name is maneesh, and my friend name is Paritosh";
$freqDist = freq_dist(tokenize($text));
print_r($freqDist); die;
我的预期输出是:maneesh,Paritosh
实际结果只是获得词频:
(
[my] => 2
[name] => 2
[is] => 2
[maneesh] => 1
[and] => 1
[friend] => 1
[Paritosh] => 1
)
答案 0 :(得分:0)
如果要使用您提到的库,则必须训练模型。这就是说,用多种可能的方式让他们说出他们的名字。但是即使如此,我还是不够完美(取决于您对模型的训练程度)。
此外,您得到的只是词频,因为这是您使用方法freq_dist
进行的分析。我认为您必须根据需要使用语料库分析。