通过仅跳过空白行来读取Excel文件(pd.read_excel())

时间:2019-12-11 05:05:14

标签: python pandas dataframe

我有一个如下数据框。

    id       date       name    branch  position
0   20323   2019-02-03  Bete    H       IE
1   20326   2019-02-03  Veso    R       MGR
2   22357   2019-02-03  Nom     D       IE
3   20935   2019-02-06  Dow     A       MGR
4   NaN     NaT         NaN     NaN     NaN
5   20432   2019-02-07  Tem     W       MGR
6   23999   NaT         Bonny   NaN     NaN
7   21102   2019-02-07  Xi      A       IE

我只想删除空白行(例如索引4)。

我尝试使用df = pd.read_excel("../20191210/test.xlsx", skip_blank_lines=True)读取数据文件。

但是与df = pd.read_excel("..20191210/test.xlsx")

的结果没有什么不同

Here是文件的下载链接。

有人可以帮我吗?

2 个答案:

答案 0 :(得分:1)

下面是df.dropna(how ='all')的示例:如果所有行都具有NaN,则不使用NaN

import pandas as pd
import numpy as np

dict = {'Col1':[100, 90, np.nan, 95],
        'Col2': [30, 45, np.nan, np.nan],
        'Col3':[np.nan, 40,np.nan, 98]}

df = pd.DataFrame(dict)
# With NaN
print(df)

# Without NaN
df = df.dropna()
print (df)

# Without NaN if all rows have NaN
df = df.dropna(how='all')
print (df)

答案 1 :(得分:0)

读取Excel文件后尝试df = df.dropna()