使用Python中的Count-in-Cells在3D星形场中进行聚类

时间:2016-12-09 10:54:28

标签: python matplotlib statistics astronomy

第一次发布海报,无法找到完全解决我问题的任何内容。

我正在为我的主人项目进行银河殖民模拟。我试图做的事情是看模拟结束后留下的未经殖民化的恒星的空隙,看看是否存在超过统计波动的聚类行为。因为它是一个蒙特卡罗数值问题,相关函数并不合适,所以我使用通常用于观察星系团的细胞计数法。

所以我在笛卡尔人工作

data = np.genfromtxt('counts.csv') # positions of uncolonsed stars
x = data[:,0]
y = data[:,1]
z = data[:,2]

我想要做的是使用不同大小的方框来计算方框内的星数,并与平均值进行比较,并对结果进行统计。

我进入的方向是查看某种3D直方图,例如看到的气泡图here。我尝试了这个,它似乎并没有将我的所有数据合并,而且我不确定为什么,即地板'这个立方体有“气泡”和“气泡”。但是大部分的屋顶都是什么都没有:

3D Bubble Histogram

当您查看绘制的原始星形区域时,这显然是错误的:

Plotted star field

看起来z值较高的箱子不能保存任何数据。这可能是一个相当简单的问题,但我需要一些新的眼睛和思想比py更好。

有谁能想到如何解决这个问题?此外,我想找到一种方法来计算每箱的点数,即每箱。

对不起,如果我有点昏暗,但我很感谢你们中的任何一位好人都能给我的帮助。

谢谢密友!

1 个答案:

答案 0 :(得分:1)

在评论中,您有一些替代方案可以解决您的问题,并且很难在没有看到代码的情况下说明您的代码有什么问题。无论如何,这种问题通常是通过计算规则网格内的数据来解决的(然而,这是进行直方图的一般方法)。

构建自己的网格的好处是,您可以立即知道每个“扇区”的位置,开始位置和结束位置。因此,如果您想尝试,我建议采用以下方法作为替代方案。

import numpy as np
from mpl_toolkits.mplot3d import Axes3D
import matplotlib.pyplot as plt

# Generating some random data.
data = np.random.randint(0, 100, (1000,3))
x, y, z = data[:, 0], data[:, 1], data[:, 2]

# Generating raw view
fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')
ax.scatter(x, y, z, marker='+', s=25, c='r')
plt.show()

# Generating some grid with origin, cell size, and number of cells 10 10 10
numx, numy, numz = 5, 5, 5
origx, origy, origz = 0, 0, 0
sizex, sizey, sizez = 20, 20, 20
grid = np.vstack(np.meshgrid(range(numx), range(numy), range(numz))).reshape(3, -1).T
gx, gy, gz = grid[:, 0]*sizex + origx, grid[:, 1]*sizey + origy, grid[:, 2]*sizez + origz

# Calculating the number of stars in each cell:
ix = ((x - origx)/sizex).astype(int)
iy = ((y - origy)/sizey).astype(int)
iz = ((z - origz)/sizez).astype(int)
s = np.zeros((numx, numy, numz))
for i in range(ix.shape[0]):
    s[ix[i], iy[i], iz[i]] = s[ix[i], iy[i], iz[i]] + 1
s = s.flatten()
mask = s > 0

# Plotting the result
fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')
ax.scatter(gx[mask], gy[mask], gz[mask], marker='o', s=s[mask]*100, c='b', edgecolor ="r")
plt.show()

随机数据的结果如下:

bubble histogram in matplotlib