使用google的diff_match_patch在这两个句子中产生差异时,我得到的结果并不正确,这表明我的观点有所不同。
句子1:
“那里有785公斤水。”
句子2:
“有800公斤水。”
当我使用任何一种清除方法运行此命令时,它们都会将每个单独的数字视为更改。伪输出为:
"There are <old>7</old>8<old>5</old><new>00</new>kg of water."
我想输出的内容是将“ 785kg”视为一个单词,将“ 800kg”视为一个单词。或更糟的情况是将“ 785”视为一个单词,将“ 800”视为一个单词。在我的情况下,输出如下所示:
"There are <old>785kg</old><new>800kg</new> of water."
或更糟糕的是:
"There are <old>785</old><new>800</new>kg of water."