Question

我正在尝试从本地文件中读取 html 表，然后使用 python 和 pandas 对其应用过滤器。（我是熊猫/蟒蛇的新手）

我正在使用以下代码读取文件：

import pandas as pd

file_path = r"C:\FILE_201704.csv"
with open(file_path, 'r') as f:
    dfs = pd.read_html(f.read(),thousands='.')
print(dfs)

这是输出：

[       COLUMN1     TOTAL
0       Value1      10000
1       Value2      11965
2       Value3      208981
3       Value4      45962
4       Value5      14568
5       Value5      05422
6       TOTAL       298034]

然后我尝试过滤“COLUMN1”中的 TOTAL 值，但出现错误：

print(dfs[dfs['COLUMN1'] != 'TOTAL'])

TypeError: list indices must be integers or slices, not str

我应该如何过滤这个？谢谢！

Answer 1

您正在使用字符串进行过滤，并且需要在您的数据帧上使用字符串方法：

df[~df['COLUMN1'].str.contains('TOTAL')]

从熊猫数据框中排除值

1 个答案: