熊猫的不确定性

时间:2014-02-10 16:06:40

标签: python pandas uncertainty

如何在Pandas(Python数据分析库)中轻松处理Series或DataFrame上的不确定性?我最近发现了Python uncertainties包,但我想知道是否有更简单的方法直接在Pandas中管理不确定性。我在文档中没有找到任何相关内容。

更确切地说,我不希望将不确定性存储为我的DataFrame中的新列,因为我认为它们是数据系列的一部分,不应在逻辑上与它分离。例如,删除DataFrame中的列而不是其不确定性没有任何意义,所以我必须手工处理这个案例。

我正在寻找像data_frame.uncertainties这样可以像data_frame.values属性一样工作的东西。 data_frame.units(对于数据单位)也会很棒,但我认为Pandas中不存在这些东西(但是?)......

1 个答案:

答案 0 :(得分:0)

如果您确实希望将其作为内置函数,则可以仅创建一个类以放入数据框。然后可以定义所需的任何值或函数。下面我写了一个简单的示例,但您可以轻松添加单位定义或更复杂的不确定性公式

import pandas as pd

data={'target_column':[100,105,110]}

class data_analysis():
    def __init__(self, data, percentage_uncertainty):
    self.df = pd.DataFrame(data)
    self.uncertainty = percentage_uncertainty*self.df['target_column'].values

我跑步时

example=data_analysis(data,.01)
example.uncertainty

我出去     array([1。,1.05,1.1])

希望这会有所帮助