将列值分配给循环内的分组天体表

时间:2017-06-15 15:45:45

标签: python astropy grouped-table

我有一个分组的星座表,并希望循环遍历各组,并分别对每个组执行裁剪均值。

下面的MWE说明了我想要做的事情。当代码运行时,它不会抛出错误,而是列的值' c'保持为0.0。我觉得我可能从根本上误解了表环境如何运作,但我不确定究竟是什么。

import numpy as np
from astropy.table import Table
from astropy.stats import sigma_clip

a = np.array([5.7, 5.9, 5.1, 5.3, 5.7, 5.4, 6.0, 8.6, 6.4, 5.2])
b = np.array([0, 0, 0, 0, 1, 1, 1, 1, 1, 1])
c = np.zeros(len(a))

tab = Table( (a,b,c), names=('a','b','c'), masked=True )

tabGrp = tab.group_by('b')

for x in tabGrp.groups:
    clipped = sigma_clip( x['a'], sigma=2)
    x['c'] = clipped

1 个答案:

答案 0 :(得分:0)

tab表格分组后,新的groups属性is added

您可以在每个sigma_clip()组中应用tabGrp,仅在列表中存储,使用此存储值创建新的MaskedColumn(正确屏蔽使用新剪切的列替换旧的c列。

它不是很优雅,但似乎做你需要的。

import numpy as np
from astropy.table import Table
from astropy.stats import sigma_clip
from astropy.table import MaskedColumn

a = np.array([5.7, 4.2, 5.1, 5.3, 5.7, 5.4, 6.0, 8.6, 6.4, 5.2])
b = np.array([0, 0, 0, 0, 1, 1, 1, 1, 1, 1])
c = np.zeros(len(a))

tab = Table((a, b, c), names=('a', 'b', 'c'), masked=True)

tabGrp = tab.group_by('b')
clipped = sigma_clip(tabGrp['a'], sigma=2)

col = []
for x in tabGrp.groups:
    clipped = sigma_clip(x['a'], sigma=2)
    # Save values only.
    col += clipped.tolist()

# Create new masked column.
c_clipped = MaskedColumn(col, mask=[True if _ is None else False for _ in col])
# Replace old c column
tab['c'] = c_clipped

结果是:

 a   b   c 
--- --- ---
5.7   0 5.7
4.2   0 4.2
5.1   0 5.1
5.3   0 5.3
5.7   1 5.7
5.4   1 5.4
6.0   1 6.0
8.6   1  --
6.4   1 6.4
5.2   1 5.2

这是你追求的吗?