用CR LF代替CR

时间:2014-08-06 20:27:53

标签: text

我在Windows上有一个奇怪的文本文件,主要包含CR + LF行结尾。 少数行仅以CR结尾。使用哪种工具将这些奇数行转换为格式良好(例如CR + LF终止)的行?

我可以使用GnuWin32工具或Python来解决这个问题。

我遇到的主要问题是我无法将文件作为文本文件打开,因为Python(因为大多数其他文本处理器,如awk)不能识别混合行结尾。所以我认为解决方案必须包含文件的二进制处理。

再一次,我不能只用CR LF替换CR,因为还存在不能触及的CR LF线路终端。

1 个答案:

答案 0 :(得分:1)

要替换线条,您可以使用正则表达式:

  • \r+找到CR
  • \r\n是您想要替换文字的文字。

Python中的正则表达式: Regular Expression


import re
txt='text where you want to replace the linebreak'
out = re.sub("\r+", '\r\n', txt)
print out