如何使用熊猫在百分比字符串列中应用过滤条件?

时间:2019-03-21 10:24:06

标签: python python-3.x pandas

original data我正在df以下工作,但无法在百分比字段中应用过滤器,但是它在正常的excel中工作。  我需要使用熊猫在特定字段中应用> 100.00%的过滤条件。

我尝试从Html,csv和excel中读取它,但无法使用条件。 它需要进行浮点转换,但不能处理给定的数据

2 个答案:

答案 0 :(得分:3)

我假定您拥有的值在Pandas中作为字符串读取:

data = ['4,700.00%', '3,900.00%', '1,500.00%', '1,400.00%', '1,200.00%', '0.15%', '0.13%', '0.12%', '0.10%', '0.08%', '0.07%']

df = pd.DataFrame(data)
df.columns = ['data']

打印df:

       data
0   4,700.00%
1   3,900.00%
2   1,500.00%
3   1,400.00%
4   1,200.00%
5      0.15%
6      0.13%
7      0.12%
8      0.10%
9      0.08%
10     0.07%

然后:

df['data'] = df['data'].str.rstrip('%').str.replace(',','').astype('float')
df_filtered = df[df['data'] > 100]

结果:

     data
0  4700.0
1  3900.0
2  1500.0
3  1400.0
4  1200.0

答案 1 :(得分:0)

我也使用了以下代码.str.rstrip('%').str.replace(',','').astype('float')正常工作