在Uproot中加载TProfile导致获得y值

时间:2019-10-24 12:28:59

标签: uproot

我无法从我的.root文件中从TProfile对象加载y值。

似乎使用file.pandas()仅加载x值,计数和方差,而不加载特定的y值。

我也尝试过file.values,它返回计数,但不返回y值

2 个答案:

答案 0 :(得分:0)

仅当根方法中包含“方法”时,从ROOT文件读取的对象才具有Pythonic解释。 TProfile尚未通过这种方式进行处理-对您而言,一切正常的唯一原因是TProfileTH1的子类,而TH1具有.pandas()方法。由于TH1用于一维直方图,因此它不包含处理第二维的代码。

uproot方法是用户贡献的。如果需要TProfile方法,则可以在此处添加一个方法并提交拉取请求:

https://github.com/scikit-hep/uproot-methods/tree/master/uproot_methods/classes

如果在此处添加包含TProfile类的Methods模块,uproot将自动加载该模块并将其应用于从ROOT文件加载的TProfile对象。

对于任何类,甚至我们从未听说过的类,uproot都将所有私有成员数据加载到Python对象中。您将在以TProfile开头的属性(例如_f_fSumw2中找到所有_fBinEntries数据。这些方法仅使用这些“内部”属性来呈现更人性化的数据图片,例如Pandas。

这是一个从未解释的TProfile获取数据的示例:

>>> import numpy
>>> import uproot
>>> 
>>> file = uproot.open("http://scikit-hep.org/uproot/examples/hepdata-example.root")
>>> hprof = file["hprof"]
>>> 
>>> numpy.sqrt(numpy.array(hprof._fSumw2) / numpy.array(hprof._fBinEntries))

将打印

-c:1: RuntimeWarning: invalid value encountered in true_divide
array([18.00160401, 17.08522023, 16.98982401, 15.18948269, 13.73788834,
       13.37976188, 13.55597897, 12.66036748, 12.68400763, 11.86598111,
       11.69668773, 11.64276616, 10.08540753, 10.15367219,  9.76541727,
        8.84047502,  8.73065944,  8.24346727,  7.46907584,  7.6620407 ,
        7.09749961,  6.62763951,  6.42199904,  5.98234406,  5.78193984,
        5.14476043,  5.15432392,  4.715674  ,  4.50246509,  4.36212988,
        3.86741244,  3.80635409,  3.60625837,  3.29332404,  3.04594764,
        2.98292569,  2.74283755,  2.50385849,  2.50978034,  2.30446027,
        2.29145554,  2.18459822,  1.99270465,  1.92651016,  1.86253428,
        1.79821825,  1.807856  ,  1.80803939,  1.75249321,  1.81588997,
        1.8226282 ,  1.74867267,  1.79842962,  1.75790778,  1.70895758,
        1.859834  ,  1.82793384,  1.96163584,  1.81903189,  2.0223054 ,
        2.14521968,  2.24565426,  2.24184203,  2.48460961,  2.63208939,
        2.69851588,  2.98989799,  3.1141892 ,  3.25304525,  3.46517157,
        3.53320406,  3.98586013,  4.25062225,  4.57520817,  4.75338005,
        5.18494724,  5.387066  ,  5.6277353 ,  5.8802666 ,  6.34427442,
        6.51966721,  7.24680462,  7.33759813,  7.63198011,  8.34535604,
        9.30064575,  8.82698396,  9.4099613 ,  9.60905376, 10.31570735,
       11.17540473, 11.13947421, 12.78232904, 12.1993165 , 12.39763587,
       16.68535354, 13.30451531, 14.67711301, 14.96741772,         nan,
       18.32199478, 17.84275258])

是此TProfile的y值。这些值的错误留给读者练习。

答案 1 :(得分:0)

TProfile的y值(h)和默认错误(err)可以根据以下条件使用私有成员数据进行重构:

import numpy
import uproot 

file = uproot.open("somefile_w_TProfile.root")
hprof = file['hprof_title']

cont = numpy.array(hprof.values)
sumw = numpy.array(hprof._fBinEntries)[1:-1]
err2 = numpy.array(hprof._fSumw2)[1:-1]

h = cont/sumw
s = numpy.sqrt(err2/sumw - h**2)
err = s/numpy.sqrt(sumw)

C ++ TProfile成员.fArray在连根TProfile对象中称为.values