以前曾经问过这个变种,但是文件I / O的处理在Python 2和3之间发生了显着的变化,我还没有发现任何有用的东西。
我的环境是Windows上的Python 3.4.1
csv文件,例如由Excel生成的那些字符串可以包含多行引用的字符串,这些字符串可以在单个字段中包含换行符(十六进制0A)。如何才能正确解析这些内容而不是将其解释为输入行的结尾?
这是一个包含两行的示例.csv文件(除标签行外)。如果重要的话,我可以输入utf-8或utf-16:
Column 1 Column 2
12345 single line of text
23456 "text with a newline here >
< that should remain in one cell"
此代码:
reader = csv.reader(open('Test.csv', newline=''), skipinitialspace = True)
for row in reader:
print(', '.join(row))
产生这个结果:
Column 1, Column 2
12345, single line of text
23456, text with a newline here >
< that should remain in one cell
提前感谢您提供的任何帮助。