Question

如何在Pandas（Python数据分析库）中轻松处理Series或DataFrame上的不确定性？我最近发现了Python uncertainties包，但我想知道是否有更简单的方法直接在Pandas中管理不确定性。我在文档中没有找到任何相关内容。

更确切地说，我不希望将不确定性存储为我的DataFrame中的新列，因为我认为它们是数据系列的一部分，不应在逻辑上与它分离。例如，删除DataFrame中的列而不是其不确定性没有任何意义，所以我必须手工处理这个案例。

我正在寻找像data_frame.uncertainties这样可以像data_frame.values属性一样工作的东西。 data_frame.units（对于数据单位）也会很棒，但我认为Pandas中不存在这些东西（但是？）......

Answer 1

如果您确实希望将其作为内置函数，则可以仅创建一个类以放入数据框。然后可以定义所需的任何值或函数。下面我写了一个简单的示例，但您可以轻松添加单位定义或更复杂的不确定性公式

import pandas as pd

data={'target_column':[100,105,110]}

class data_analysis():
    def __init__(self, data, percentage_uncertainty):
    self.df = pd.DataFrame(data)
    self.uncertainty = percentage_uncertainty*self.df['target_column'].values

我跑步时

example=data_analysis(data,.01)
example.uncertainty

我出去 array（[1。，1.05，1.1]）

希望这会有所帮助

熊猫的不确定性

1 个答案: