在熊猫中读取html时如何定义选定的列名称

时间:2020-04-25 16:16:51

标签: python-3.x pandas dataframe

有没有办法使用自定义列名示例col_names,我在下面有42个列名,我只需要这3个,在阅读html时可以定义它们吗?

读取HTML文件:

df = pd.read_html(file.text, use_cols=con_names)

以上使用col_names的方法无效。

自定义选定的列名称:

col_names = [ 'col1', 'col4', 'col14' ]

我尝试过的工作以及为我工作的方法:

我可以如下直接使用的一种方法...

print(df[['col1', 'col4', 'col14']])

1 个答案:

答案 0 :(得分:1)

read_html不支持'use_cols'。一个快速的解决方法是:

df_2 = df[['col1', 'col4', 'col14']]