如何在Pandas(Python数据分析库)中轻松处理Series或DataFrame上的不确定性?我最近发现了Python uncertainties包,但我想知道是否有更简单的方法直接在Pandas中管理不确定性。我在文档中没有找到任何相关内容。
更确切地说,我不希望将不确定性存储为我的DataFrame中的新列,因为我认为它们是数据系列的一部分,不应在逻辑上与它分离。例如,删除DataFrame中的列而不是其不确定性没有任何意义,所以我必须手工处理这个案例。
我正在寻找像data_frame.uncertainties
这样可以像data_frame.values
属性一样工作的东西。 data_frame.units
(对于数据单位)也会很棒,但我认为Pandas中不存在这些东西(但是?)......
答案 0 :(得分:0)
如果您确实希望将其作为内置函数,则可以仅创建一个类以放入数据框。然后可以定义所需的任何值或函数。下面我写了一个简单的示例,但您可以轻松添加单位定义或更复杂的不确定性公式
import pandas as pd
data={'target_column':[100,105,110]}
class data_analysis():
def __init__(self, data, percentage_uncertainty):
self.df = pd.DataFrame(data)
self.uncertainty = percentage_uncertainty*self.df['target_column'].values
我跑步时
example=data_analysis(data,.01)
example.uncertainty
我出去 array([1。,1.05,1.1])
希望这会有所帮助