里面有'2'字符?

时间:2013-07-22 16:28:43

标签: python character

编辑:到目前为止确定:它不是2,它是两个十六进制值BF之前的一个字符,导致下一个字符中的星号(恰好是2)

我正在使用我编写的python脚本运行弹性mapreduce作业,并且我以意外行的形式得到一些奇怪的输出。然而,我注意到了一种模式。预期的线条都有意想不到的'2'字符形式,小角星位于角色的顶部曲线内。也就是说,当我在Notepad ++(但不是记事本或Word)中打开文件时,我看到有两个这样的人出现(请原谅链接,我无法以少于10个代表嵌入图像):

  

在文字中:http://i.imgur.com/zaWtC3S.png
  放大:http://i.imgur.com/bTYIlh6.png

当我在自己的机器上运行python脚本时,奇怪的'2'也出现了(虽然意外的行没有)。有谁知道这可能导致什么?它可能会对我得到的奇数额外输出线有所了解。我也只是真的很好奇。

另外,我认为它可能与解析安全URL的编码/解码有关,但当我拿出那些部分时,奇怪的'2'仍然存在,所以不是那样。

由于

1 个答案:

答案 0 :(得分:2)

你有EF BB BF ...这是BOM标记的UTF-8编码:字节顺序标记。见http://en.wikipedia.org/wiki/Byte_order_mark。我怀疑这封信中的明星是你编辑的方式,表示“我刚收到一张BOM”。见this earlier question。它似乎是一个众所周知的“事物”,该线程有一些处理它的建议。