我有这种格式的Pandas Dataframe
0 or LIST requests
1 us-west-2
2 1.125e-05
3 0
4 3.032e-05
5 0
6 7.28e-06
7 or LIST requests
8 3.1e-07
9 0
10 0
11 1.067e-05
12 0.00011983
13 0.1075269
14 or LIST requests
15 us-west-2
16 0
17 2.88e-06
18 ap-northeast-2
19 5.52e-06
20 6.15e-06
21 3.84e-06
22 or LIST requests
我想在pandas中用0替换所有非数字单元格。我正在尝试这样的事情,但没有任何作用,
training_data['usagequantity'].replace({'^([A-Za-z]|[0-9]|_)+$': 0}, regex=True)
任何提示我该怎么做:
答案 0 :(得分:2)
import pandas as pd
from StringIO import StringIO
text = """0 or LIST requests
1 us-west-2
2 1.125e-05
3 0
4 3.032e-05
5 0
6 7.28e-06
7 or LIST requests
8 3.1e-07
9 0
10 0
11 1.067e-05
12 0.00011983
13 0.1075269
14 or LIST requests
15 us-west-2
16 0
17 2.88e-06
18 ap-northeast-2
19 5.52e-06
20 6.15e-06
21 3.84e-06
22 or LIST requests"""
df = pd.read_csv(StringIO(text), sep='\s{2,}', engine='python', index_col=[0], header=None)
使用pd.to_numeric
pd.to_numeric(df.iloc[:, 0], errors='coerce').fillna(0)
将此列分配到您想要的位置。
答案 1 :(得分:2)
以下代码可以工作:
df.col =pd.to_numeric(df.col, errors ='coerce').fillna(0).astype('int')
答案 2 :(得分:1)
您可以使用to_numeric
方法,但不会更改值。您需要将列设置为新值:
training_data['usagequantity'] = (
pd.to_numeric(training_data['usagequantity'],
errors='coerce')
.fillna(0)
)
to_numeric将非数字值设置为NaNs
,然后链式fillna方法用零替换NaNs
。