对于下面的数据框,我正在使用代码
df['%'] = ((df['Code Lines'] / df['Code Lines'].sum()) * 100).round(2).astype(str) + '%'
输出
Language # of Files Blank Lines Comment Lines Code Lines %
C++ 15 66 35 354 6.13%
C/C++ Header 1 3 7 4 0.07%
Markdown 6 73 0 142 2.46%
Python 110 1998 2086 4982 86.27%
Tcl/Tk 1 14 18 273 4.73%
YAML 1 0 6 20 0.35%
我正在尝试将str转换为float
df['%'] = df['% of Total (Code Only)'].astype('float64')
遇到错误
文件 “ /Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages/pandas/core/dtypes/cast.py”, 第730行,位于astype_nansafe中 返回arr.astype(dtype,copy = True)ValueError:无法将字符串转换为float:'0.35%'
有没有一种方法可以将列%与符号%保持为浮点数
答案 0 :(得分:5)
使用str[:-1]
删除indexing with str的最后一个值(%
):
df['%'] = df['%'].str[:-1].astype('float64')
但如果可能更好,那就是:
df['%'] = ((df['Code Lines'] / df['Code Lines'].sum()) * 100).round(2)
print (df)
Language # of Files Blank Lines Comment Lines Code Lines %
0 C++ 15 66 35 354 6.13
1 C/C++ Header 1 3 7 4 0.07
2 Markdown 6 73 0 142 2.46
3 Python 110 1998 2086 4982 86.27
4 Tcl/Tk 1 14 18 273 4.73
5 YAML 1 0 6 20 0.35
答案 1 :(得分:1)
另一种方式,使用strip
:
df['%'] = df['%'].str.strip('%').astype('float64')
0 6.13
1 0.07
2 2.46
3 86.27
4 4.73
5 0.35
Name: %, dtype: float64
答案 2 :(得分:0)
您可以如下所示从字符串中删除最后一个字符:
str[:-1]
删除最后一个字符
df['%'] = df['%'].str[:-1].astype('float64')
或者您可以使用replace()将%
替换为空白字符。
df['%'] = df['%'].replace("%","").astype('float64')