行终止符而不是空格pandas read_csv

时间:2017-05-24 01:32:49

标签: python python-3.x pandas

我的数据集在我的时间字段中有一个行终止符,如下所示:

文字档案

website.com/?rest_route=/

当前代码:

我目前正在尝试将其读入num1 Name Num dan pan fran time ---- ------ ---- ---- ---- ----- ---------------------------- 52345 john 12 True True False <LF> 43214 Matt 56 False False True 2008-12-12 01:01:47 UTC+0000<LF> 12345 Adam 13 True True False <LF> 54321 Sam 23 False True True <LF> ,如下所示:

pandas.DataFrame

当前结果:

我收到的数据已移位,因为我无法识别时间字段中的空白值,如下所示:

pd.read_csv(file.txt, delim_white_space=True, skiprows=range(1,2)).fillna("NONE) 

问题:

如何预解析我的数据以使时间字段包含空格或&#34; NONE&#34;然后适当地读入大熊猫或让大熊猫认识到有缺失值?

预期输出:

    num1  Name    Num   dan    pan   fran    time
    52345 john    12    True   True  False   <LF>
43214 Matt    56    False  False True    2008-12-12 01:01:47 UTC+0000
    12345 Adam    13    True   True  False   <LF>
    54321 Sam     23    False  True  True    <LF>

1 个答案:

答案 0 :(得分:1)

我建议pandas.read_fwf:

<强>代码:

df = pd.read_fwf('file1', skiprows=range(1, 2)).fillna("NONE")

<强>结果:

    num1  Name  Num    dan    pan   fran                          time
0  52345  john   12   True   True  False                          NONE
1  43214  Matt   56  False  False   True  2008-12-12 01:01:47 UTC+0000
2  12345  Adam   13   True   True  False                          NONE
3  54321   Sam   23  False   True   True                          NONE