我在Windows上有一个奇怪的文本文件,主要包含CR + LF行结尾。 少数行仅以CR结尾。使用哪种工具将这些奇数行转换为格式良好(例如CR + LF终止)的行?
我可以使用GnuWin32工具或Python来解决这个问题。
我遇到的主要问题是我无法将文件作为文本文件打开,因为Python(因为大多数其他文本处理器,如awk)不能识别混合行结尾。所以我认为解决方案必须包含文件的二进制处理。
再一次,我不能只用CR LF替换CR,因为还存在不能触及的CR LF线路终端。
答案 0 :(得分:1)
要替换线条,您可以使用正则表达式:
\r+
找到CR \r\n
是您想要替换文字的文字。Python中的正则表达式: Regular Expression
import re
txt='text where you want to replace the linebreak'
out = re.sub("\r+", '\r\n', txt)
print out