我有一个csv文件example.csv
,就像-
name | hits
---------------
A | 34
B | 30
C | 25
D | 20
在Python中使用pandas
,我如何只读取带有 hits > 20
的行?寻找类似的东西-
my_df = pd.read_csv('example.csv', where col('hits') > 20)
答案 0 :(得分:1)
阅读整个csv并进行如下过滤
my_df = pd.read_csv("example.csv")
my_df = my_df[my_df['hits']>20]
如果读取时遇到内存问题,可以设置chunksize
参数以大块读取它
答案 1 :(得分:1)
读取整个csv,然后使用query()方法选择所需的部分:
required_df = my_df.query("hits > 20")
或
required_df =df.loc[df['hits']>20]
答案 2 :(得分:0)
一旦您从任何来源创建了数据框,就可以简单地使用
dataframe_name ['column_name'](条件)(值)
类似
dataframe['score'] > 200