如何在一列中比较两个具有不同精度级别的数据框

时间:2019-05-03 21:35:54

标签: python dataframe

我通过使用以下代码将df_one与df_two比较来创建结果数据框。

df_results = pd.DataFrame(df_one.eq(db_two))

这很好用,但是df_one中的一列具有精度为9的浮点数,另一列的精度为12。如果小数点后的前9个数字为,我希望测试返回true。相等,即使最后三个不相等。

所以我最终比较了下面两个值。

Column One              Column Two
------------------      ------------------
42.123456789            42.123456789012

我知道我可以使用set_option设置更改显示的精度级别。

pd.set_option("precision", 9)

不幸的是,这仅用于显示,因此不会影响eq函数进行的比较。

任何帮助都需要事先感谢。

1 个答案:

答案 0 :(得分:1)

如@ duncster94所述,尝试:

>>> import pandas as pd
>>> df = pd.DataFrame([[42.123456789,42.123456789012]], columns=list('AB'))
>>> df[df.A==round(df.B, 10)]
           A          B
0  42.123457  42.123457
>>>

或者您甚至可以使用math.isclose

>>> import pandas as pd
>>> from math import isclose
>>> df = pd.DataFrame([[42.123456789,42.123456789012]], columns=list('AB'))
>>> df[df.apply(lambda row: isclose(row.A, row.B, rel_tol=1e-12), axis=1)]
           A          B
0  42.123457  42.123457
>>> df[df.apply(lambda row: isclose(row.A, row.B, rel_tol=1e-13),axis=1)]
Empty DataFrame
Columns: [A, B]
Index: []