我正在尝试从本地文件中读取 html 表,然后使用 python 和 pandas 对其应用过滤器。 (我是熊猫/蟒蛇的新手)
我正在使用以下代码读取文件:
import pandas as pd
file_path = r"C:\FILE_201704.csv"
with open(file_path, 'r') as f:
dfs = pd.read_html(f.read(),thousands='.')
print(dfs)
这是输出:
[ COLUMN1 TOTAL
0 Value1 10000
1 Value2 11965
2 Value3 208981
3 Value4 45962
4 Value5 14568
5 Value5 05422
6 TOTAL 298034]
然后我尝试过滤“COLUMN1”中的 TOTAL 值,但出现错误:
print(dfs[dfs['COLUMN1'] != 'TOTAL'])
TypeError: list indices must be integers or slices, not str
我应该如何过滤这个? 谢谢!
答案 0 :(得分:1)
您正在使用字符串进行过滤,并且需要在您的数据帧上使用字符串方法:
df[~df['COLUMN1'].str.contains('TOTAL')]