应用错误收集

我是python的新手，正在尝试找出解决数据分析问题的最佳方法。如果这个问题看起来很基本，请道歉我基本上想要帮助确定是否要使用元组，dicts或pandas数据帧来存储我的数据。这是我的情景：

我的数据：我有一个3D空间数据集，数据位于不均匀的XYZ位置。数据点的精确位置至关重要，因此我无法重新采样到偶数网格，这将更容易处理。每个XYZ数据点都有一组相关的细节，包括字符，整数，浮点数和布尔类。我基本上有一个相当混乱的云＆＃39;数据。

我的目标：我希望能够检查每一种类型的问题＆＃39; X＆＃39;在数据集中，查看给定半径内所有其他点的属性（它们是什么类型，以及各种其他特征）。

我的问题：存储和查询此类数据的最有效方法是什么？直观地说，一个包含x，y，z，......列的pandas数据框是有意义的，但鉴于我将使用大型数据集，我担心这是否是最有效的方法。创建一个dict对象是明智的，其中定义是XYZ元组，而存储的值是dict包含该点特征的对象吗？有没有明显的方法可以做到这一点，我错过了？

非常感谢任何帮助/建议！

提前致谢。

处理xyz数据的最佳方法

1 个答案: