我有一个分组的星座表,并希望循环遍历各组,并分别对每个组执行裁剪均值。
下面的MWE说明了我想要做的事情。当代码运行时,它不会抛出错误,而是列的值' c'保持为0.0。我觉得我可能从根本上误解了表环境如何运作,但我不确定究竟是什么。
import numpy as np
from astropy.table import Table
from astropy.stats import sigma_clip
a = np.array([5.7, 5.9, 5.1, 5.3, 5.7, 5.4, 6.0, 8.6, 6.4, 5.2])
b = np.array([0, 0, 0, 0, 1, 1, 1, 1, 1, 1])
c = np.zeros(len(a))
tab = Table( (a,b,c), names=('a','b','c'), masked=True )
tabGrp = tab.group_by('b')
for x in tabGrp.groups:
clipped = sigma_clip( x['a'], sigma=2)
x['c'] = clipped
答案 0 :(得分:0)
将tab
表格分组后,新的groups
属性is added。
您可以在每个sigma_clip()
组中应用tabGrp
,仅在列表中存储值,使用此存储值创建新的MaskedColumn(正确屏蔽使用新剪切的列替换旧的c
列。
它不是很优雅,但似乎做你需要的。
import numpy as np
from astropy.table import Table
from astropy.stats import sigma_clip
from astropy.table import MaskedColumn
a = np.array([5.7, 4.2, 5.1, 5.3, 5.7, 5.4, 6.0, 8.6, 6.4, 5.2])
b = np.array([0, 0, 0, 0, 1, 1, 1, 1, 1, 1])
c = np.zeros(len(a))
tab = Table((a, b, c), names=('a', 'b', 'c'), masked=True)
tabGrp = tab.group_by('b')
clipped = sigma_clip(tabGrp['a'], sigma=2)
col = []
for x in tabGrp.groups:
clipped = sigma_clip(x['a'], sigma=2)
# Save values only.
col += clipped.tolist()
# Create new masked column.
c_clipped = MaskedColumn(col, mask=[True if _ is None else False for _ in col])
# Replace old c column
tab['c'] = c_clipped
结果是:
a b c
--- --- ---
5.7 0 5.7
4.2 0 4.2
5.1 0 5.1
5.3 0 5.3
5.7 1 5.7
5.4 1 5.4
6.0 1 6.0
8.6 1 --
6.4 1 6.4
5.2 1 5.2
这是你追求的吗?