抑制大熊猫的科学记数法?

时间:2013-07-19 02:41:44

标签: python numpy pandas

我在pandas中有一个DataFrame,其中一些数字用科学记数法(或指数表示法)表示,如下所示:

                  id        value
id              1.00    -4.22e-01
value          -0.42     1.00e+00
percent        -0.72     1.00e-01
played          0.03    -4.35e-02
money          -0.22     3.37e-01
other            NaN          NaN
sy             -0.03     2.19e-04
sz             -0.33     3.83e-01

科学记数法应该是一个简单的比较,不必要的困难。我认为它是21900的价值,正在为其他人搞砸。我的意思是1.0编码。一!

这不起作用:

np.set_printoptions(supress=True) 

并且pandas.set_printoptions也没有实现抑制,我在绝望中看了pd.describe_options(),而pd.core.format.set_eng_float_format()似乎只为所有其他浮点值打开了它,无法将其关闭。

5 个答案:

答案 0 :(得分:41)

快速临时:df.round(4)

全球:pd.options.display.float_format = '{:20,.2f}'.format

答案 1 :(得分:9)

您的数据可能是object dtype。这是您数据的直接复制/粘贴。 read_csv将其解释为正确的dtype。您通常只应在类似字符串的字段上使用object dtype。

In [5]: df = read_csv(StringIO(data),sep='\s+')

In [6]: df
Out[6]: 
           id     value
id       1.00 -0.422000
value   -0.42  1.000000
percent -0.72  0.100000
played   0.03 -0.043500
money   -0.22  0.337000
other     NaN       NaN
sy      -0.03  0.000219
sz      -0.33  0.383000

检查您的dtypes是否为object

In [7]: df.dtypes
Out[7]: 
id       float64
value    float64
dtype: object

这会将此框架转换为object dtype(注意打印现在很有趣)

In [8]: df.astype(object)
Out[8]: 
           id     value
id          1    -0.422
value   -0.42         1
percent -0.72       0.1
played   0.03   -0.0435
money   -0.22     0.337
other     NaN       NaN
sy      -0.03  0.000219
sz      -0.33     0.383

这是如何将其转换回来(astype(float))也可以在这里工作

In [9]: df.astype(object).convert_objects()
Out[9]: 
           id     value
id       1.00 -0.422000
value   -0.42  1.000000
percent -0.72  0.100000
played   0.03 -0.043500
money   -0.22  0.337000
other     NaN       NaN
sy      -0.03  0.000219
sz      -0.33  0.383000

这是object dtype框架的样子

In [10]: df.astype(object).dtypes
Out[10]: 
id       object
value    object
dtype: object

答案 2 :(得分:1)

无需四舍五入的快速修复:

pd.options.display.float_format = '{:.0f}'.format

答案 3 :(得分:0)

如果您希望将值用作列表中的格式化字符串,例如csvfile csv.writier的一部分,则可以在创建列表之前格式化数字:

df['label'].apply(lambda x: '%.17f' % x).values.tolist()

答案 4 :(得分:0)

尝试使用此方法,它只会为大和非常小的值提供科学的表示法(除非省略“,”,否则会添加千位分隔符):

pd.set_option('display.float_format', lambda x: '%,g' % x)

或者为了几乎完全抑制科学计数法而不损失精度,请尝试以下方法:

pd.set_option('display.float_format', str)