我有一个数据文件,其中包含一个以竖线分隔的标题行,并且所有字段都包含在引号中。另外,我文件中的字段可能包含回车符,并且分成多行。
示例文件:
"Unique_Id"|"AnotherField"|"TextFieldWithCarriageReturn"|"EmptyField"
"RecordID1"|"SomeValue"|"This is an example field log, contained within is a carriage return,
here is the second line of this field"|""
"RecordID2"|"SomeValue2"|"Same Field but without a carriage return"|""
无论我如何尝试,我都无法让熊猫停止将回车视为新的记录标识符。
pd.read_csv('Data/Test.csv', sep='|', header=0)
为什么熊猫忽略了|作为分隔符,我该如何解决此问题?
任何帮助,深表感谢。
答案 0 :(得分:0)
再说我的,这是代码的输出,您得到什么输出?
df = pd.read_csv('test.csv', sep='|', header=0)
print(df)
Unique_Id AnotherField TextFieldWithCarriageReturn EmptyField
0 RecordID1 SomeValue This is an example field log, contained within... NaN
1 RecordID2 SomeValue2 Same Field but without a carriage return NaN