我需要从一堆文件中替换一些句子。所有句子几乎相同,但在某些文件中是中断,缺失或添加的单词/字符。我试着匹配第一个和最后一个词,但那不准确。
有没有办法或有没有人知道如何替换几乎匹配的句子?
示例 假设我想替换下面的句子。
Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt
这是一个休息的句子
Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt
缺少逗号
Lorem ipsum dolor sit amet, consetetur sadipscing elitr sed diam nonumy eirmod tempor invidunt
缺少字词
Lorem ipsum dolor sit amet sadipscing elitr, sed diam nonumy invidunt
答案 0 :(得分:1)
未经测试,但请查看similar_text();
<?php
$threshold = 80; //Percentage threshold
$par1 = "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt";
$par2 = "Lorem ipsum dolor sit amet, consetetur sadipscing elitr,
sed diam nonumy eirmod tempor invidunt";
$percent = similar_text($par1,$par2);
if ($percent < $threshold) {
//Correct the incorrect paragraph
$par2 = $par1;
}
?>