在阅读html(pandas.read_html)时,如何在一行中选择dataframe和set_ index

时间:2016-09-22 04:11:42

标签: pandas dataframe

我正在阅读一个html,它会带回一个数据帧列表。我希望能够从列表中选择数据框,并将我的索引(index_col)设置为最少的行。

这就是我现在所拥有的:

import pandas as pd
df =pd.read_html('http://finviz.com/insidertrading.ashx?or=-10&tv=100000&tc=1&o=-transactionvalue', header = 0)
df2 =df[4]   #here I'm assigning df2 to dataframe#4 from the list of dataframes I read
df2.set_index('Date', inplace =True)   

是否可以在一行中完成所有这些操作?我是否需要创建另一个数据帧(df2)来从列表中分配一个数据帧,或者我可以在读取数据帧列表(df)后立即分配数据帧。

感谢。

1 个答案:

答案 0 :(得分:1)

反正:

import pandas as pd

df = pd.read_html('http://finviz.com/insidertrading.ashx?or=-10&tv=100000&tc=1&o=-transactionvalue', header = 0)[4].set_index('Date')