我的数据集在我的时间字段中有一个行终止符,如下所示:
文字档案
website.com/?rest_route=/
当前代码:
我目前正在尝试将其读入num1 Name Num dan pan fran time
---- ------ ---- ---- ---- ----- ----------------------------
52345 john 12 True True False <LF>
43214 Matt 56 False False True 2008-12-12 01:01:47 UTC+0000<LF>
12345 Adam 13 True True False <LF>
54321 Sam 23 False True True <LF>
,如下所示:
pandas.DataFrame
当前结果:
我收到的数据已移位,因为我无法识别时间字段中的空白值,如下所示:
pd.read_csv(file.txt, delim_white_space=True, skiprows=range(1,2)).fillna("NONE)
问题:
如何预解析我的数据以使时间字段包含空格或&#34; NONE&#34;然后适当地读入大熊猫或让大熊猫认识到有缺失值?
预期输出:
num1 Name Num dan pan fran time
52345 john 12 True True False <LF>
43214 Matt 56 False False True 2008-12-12 01:01:47 UTC+0000
12345 Adam 13 True True False <LF>
54321 Sam 23 False True True <LF>
答案 0 :(得分:1)
<强>代码:强>
df = pd.read_fwf('file1', skiprows=range(1, 2)).fillna("NONE")
<强>结果:强>
num1 Name Num dan pan fran time
0 52345 john 12 True True False NONE
1 43214 Matt 56 False False True 2008-12-12 01:01:47 UTC+0000
2 12345 Adam 13 True True False NONE
3 54321 Sam 23 False True True NONE