这是一个非常简单的问题,但我无法弄清楚为什么会发生这种情况。我试图打印整个文本,但以下代码只打印了大约一半或更少:
textfile = open("helloworld.txt")
body = textfile.read()
print body
和
textfile = open("helloworld.txt")
for line in textfile:
line = line.rstrip()
print line
答案 0 :(得分:0)
我之前提交的代码完全没有意义,为什么你会解码utf-8再次在utf-8中编码?
算了,但让我试一试。
这是我的建议print open('FileLocation').read()
这可能是一个os问题而不是python问题。如果操作系统不喜欢某些数据,它可能会替换甚至不打印这样的字符到终端/ cmd
我个人使用Linux,从未遇到过这样的问题。问题可能会进一步延迟到内存使用情况,但我有点怀疑,因为它不会给你带来任何错误。您是否可以对您的文档进行采样,以便我或其他人可以使用它来寻找解决方案?
答案 1 :(得分:-1)
当遇到类似的问题时 - 我经常发现问题是由于糟糕的UTF-8编码造成的。当它看到这个糟糕的数据时,Python就会崩溃。
因此,我使用两种方法中的一种来克服它
1)在python代码之前转换,即
cat Some_File.txt | iconv -f utf-8 -t utf-8 -c | python my_py_code.py
-c开关意味着忽略不良的UTF-8字符。
2)仅使用python
#include <stdio.h>
int main() {
printf("test...\n");
return 0;
}
希望有所帮助