使用php修复文本文件中的奇怪缩进

时间:2017-04-25 03:53:34

标签: php parsing text

我正在接受this file并将其分成句子。问题在于它的格式很奇怪。我需要删除所有随机的新行,缩进和不需要的空格。有没有办法用PHP做到这一点?

我目前正在使用

$test= file_get_contents("text.txt");
$stringtest = str_replace(PHP_EOL,'', $test);

但是当我试图分开句子时,我的行为很奇怪。有没有办法做到这一点?

奇怪的行为是当我打印出文本时

echo $stringtest;

在换行符/ weird_spacing曾经存在的行之间存在看不见的字符。

1 个答案:

答案 0 :(得分:1)

您可以使用正则表达式将所有空格合并到一个空格中。您也可能想要在开头和结尾删除空格。试试这个:

$test = trim($test);
$test = preg_replace('/\s+/s', ' ', $test);