如何摆脱我从网站上删除的数据中的“^ M”?

时间:2011-04-24 19:42:20

标签: python html

我的数据如下:

"1964   iwanttoholdyourhand beatles



^M

oh yeah, i'll tell you something
i think you'll understand
when i'll say that something
i wanna hold your hand
i wanna hold your hand
i wanna hold your hand

oh please, say to me
you'll let me be your man
and please, say to me
you'll let me hold your hand
i'll let me hold your hand
i wanna hold your hand"

我试图摆脱^ M,所以我尝试使用re.sub但是找不到它 - 我认为是一些特殊的角色而不是实际上是“^”和“M”对彼此。有关如何删除它的任何想法? 谢谢!

2 个答案:

答案 0 :(得分:5)

^ M用于表示许多编辑器中的回车符。您通常会在这些编辑器中键入Ctrl + M来生成该字符。

Python将此表示为'\r',与大多数编程语言一样。

答案 1 :(得分:1)

这可能是Windows与unix行结尾问题。 Unix使用\ n(换行符),windows使用\ r \ n而不是(回车+换行符)。你想删除\ r \ n(ASCII代码点13);你可以在python中完成它(我甚至不使用正则表达式),或者你只需​​在你的文件上运行fromdos程序。许多unix工具将\ r表示为^ M(M是字母表的第13个字母)。

This wikipedia article是一个很好的起点。