熊猫将列从str转换为float

时间:2018-07-16 13:20:09

标签: python python-3.x pandas

对于下面的数据框,我正在使用代码

df['%'] = ((df['Code Lines'] / df['Code Lines'].sum()) * 100).round(2).astype(str) + '%'

输出

Language    # of Files  Blank Lines Comment Lines   Code Lines  % 
C++              15          66           35            354    6.13%
C/C++ Header      1           3            7              4    0.07%
Markdown          6           73           0            142    2.46%
Python           110         1998       2086           4982    86.27%
Tcl/Tk            1          14           18            273    4.73%
YAML              1           0            6             20    0.35%

我正在尝试将str转换为float

df['%'] = df['% of Total (Code Only)'].astype('float64')

遇到错误

  

文件   “ /Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages/pandas/core/dtypes/cast.py”,   第730行,位于astype_nansafe中       返回arr.astype(dtype,copy = True)ValueError:无法将字符串转换为float:'0.35%'

有没有一种方法可以将列%与符号%保持为浮点数

3 个答案:

答案 0 :(得分:5)

使用str[:-1]删除indexing with str的最后一个值(%):

df['%'] = df['%'].str[:-1].astype('float64')

但如果可能更好,那就是:

df['%'] = ((df['Code Lines'] / df['Code Lines'].sum()) * 100).round(2)

print (df)
       Language  # of Files  Blank  Lines Comment  Lines Code Lines      %
0           C++          15     66             35               354   6.13
1  C/C++ Header           1      3              7                 4   0.07
2      Markdown           6     73              0               142   2.46
3        Python         110   1998           2086              4982  86.27
4        Tcl/Tk           1     14             18               273   4.73
5          YAML           1      0              6                20   0.35

答案 1 :(得分:1)

另一种方式,使用strip

df['%'] = df['%'].str.strip('%').astype('float64')

0     6.13
1     0.07
2     2.46
3    86.27
4     4.73
5     0.35
Name: %, dtype: float64

答案 2 :(得分:0)

您可以如下所示从字符串中删除最后一个字符:

str[:-1]删除最后一个字符

df['%'] = df['%'].str[:-1].astype('float64')

或者您可以使用replace()将%替换为空白字符。

df['%'] = df['%'].replace("%","").astype('float64')