我有一个按句子分割文字的功能:
public static function getSentences($str) {
return preg_split('/(?<=[.?!;:])\s+/', $str, -1, PREG_SPLIT_NO_EMPTY);
}
但发现问题:
物体在11月1日左右通过火星的轨道并将通过木星的轨道 轨道在2018年5月。 它将在2019年1月超越土星的轨道;当它离开我们的太阳系时,'Oumuamua将前往Pegasus星座。
上面的函数用四个句子分割了这个文本。 (之后:...... 11月; ...... 2019年;);
如何解决此问题?
谢谢!