带有多行字段的熊猫Read_CSV

时间:2020-06-24 15:03:07

标签: python pandas csv

我有一个数据文件,其中包含一个以竖线分隔的标题行,并且所有字段都包含在引号中。另外,我文件中的字段可能包含回车符,并且分成多行。

示例文件:

"Unique_Id"|"AnotherField"|"TextFieldWithCarriageReturn"|"EmptyField"
"RecordID1"|"SomeValue"|"This is an example field log, contained within is a carriage return,
here is the second line of this field"|""
"RecordID2"|"SomeValue2"|"Same Field but without a carriage return"|""

无论我如何尝试,我都无法让熊猫停止将回车视为新的记录标识符。

pd.read_csv('Data/Test.csv', sep='|', header=0)

为什么熊猫忽略了|作为分隔符,我该如何解决此问题?

任何帮助,深表感谢。

1 个答案:

答案 0 :(得分:0)

再说我的,这是代码的输出,您得到什么输出?

df = pd.read_csv('test.csv', sep='|', header=0)
print(df)

   Unique_Id AnotherField                        TextFieldWithCarriageReturn  EmptyField
0  RecordID1    SomeValue  This is an example field log, contained within...         NaN
1  RecordID2   SomeValue2           Same Field but without a carriage return         NaN