为什么我不能清理用read_html属性提取的表?

时间:2017-05-10 08:03:58

标签: pandas

我期待提取一个包含read_html属性的表。

route=pd.read_html(https://whatever.com,flavor='html5lib',thousands='.', decimal=',')

我对数组的第一个值感兴趣,它带来了这样一个表:

route[1]:

   Cambio de %    Volumen
0          NaN        NaN
1          NaN        NaN
2          NaN        NaN
3       -0,00%   136376.0
4          NaN        NaN
5       -0,02%    50941.0
6       -0,04%   152213.0
7       -0,07%   146387.0 

我想清理NaN行,因此我尝试了这个:

return (route[1]).dropna(inplace=True)

返回None

我试图将route[1]存储在一个变量中并像这样调用它:

tabla_rdos=route[1]
tabla_rdos=route[1].dropna(inplace=True)

回复:

 'NoneType' object has no attribute 'dropna'

然后我查了一下:

return: tabla_rdos

返回None

我只想返回通过read_html获得的表而没有NaN值。我不明白为什么会这么挣扎。

1 个答案:

答案 0 :(得分:1)

您需要删除inplace=True,因为如果pandas中的inplace=True发挥作用,它始终会返回None

return (ruta[1]).dropna()