Question

我期待提取一个包含read_html属性的表。

route=pd.read_html(https://whatever.com,flavor='html5lib',thousands='.', decimal=',')

我对数组的第一个值感兴趣，它带来了这样一个表：

route[1]:

   Cambio de %    Volumen
0          NaN        NaN
1          NaN        NaN
2          NaN        NaN
3       -0,00%   136376.0
4          NaN        NaN
5       -0,02%    50941.0
6       -0,04%   152213.0
7       -0,07%   146387.0

我想清理NaN行，因此我尝试了这个：

return (route[1]).dropna(inplace=True)

返回None

我试图将route[1]存储在一个变量中并像这样调用它：

tabla_rdos=route[1]
tabla_rdos=route[1].dropna(inplace=True)

回复：

 'NoneType' object has no attribute 'dropna'

然后我查了一下：

return: tabla_rdos

返回None

我只想返回通过read_html获得的表而没有NaN值。我不明白为什么会这么挣扎。

Answer 1

您需要删除inplace=True，因为如果pandas中的inplace=True发挥作用，它始终会返回None：

return (ruta[1]).dropna()

为什么我不能清理用read_html属性提取的表？

1 个答案: