今天开始学习这些东西,请原谅我的无知。
我的数据在csv中,如标题中所述,我想排除第一行和第三行,同时将第二行保留为标题。 csv看起来像这样:
"Title"
Date, time, count, hours, average
"empty row"
数据集从空行之后的行开始。
答案 0 :(得分:3)
使用pd.read_csv
的skiprows
参数:
from io import StringIO
x = StringIO("""Title
Date, time, count, hours, average
2018-01-01, 15:23, 16, 10, 5.5
2018-01-02, 16:33, 20, 5, 12.25
""")
# replace x with 'file.csv'
df = pd.read_csv(x, skiprows=[0, 2])
print(df)
Date time count hours average
0 2018-01-01 15:23 16 10 5.50
1 2018-01-02 16:33 20 5 12.25
事实上,skiprows=[0]
就足够了,因为默认情况下排除空行,即默认行为是skip_blank_lines=True
。
答案 1 :(得分:0)
使用read_csv
中的参数header=1
仅将第二行读入列,因为默认情况下排除空行:
import pandas as pd
temp=u"""Title
Date,time,count,hours,average
2015-01-01,25:02:10,10,20,15"""
#after testing replace 'pd.compat.StringIO(temp)' to 'filename.csv'
df = pd.read_csv(pd.compat.StringIO(temp), header=1)
print (df)
Date time count hours average
0 2015-01-01 25:02:10 10 20 15