Python DataFrame或用于存储对象的列表

时间:2017-05-27 16:11:21

标签: python pandas numpy

我可以"存储" pandas / numpy中的类实例Series-DataFrame / ndarray 就像我在列表中一样?或者这些库支持内置类型(数字,字符串)。

例如,我的Point坐标为x,y,我想将Points存储在Plane中,这将返回给定坐标的Point。< / p>

#my class
class MyPoint:

    def __init__(self, x,y):
        self.x = x
        self.y = y

    @property
    def x(self):
        return self.x

    @property
    def y(self):
        return self.y

我在这里创建实例:

first_point = MyClass(1,1)
second_point = MyClass(2,2)

我可以将实例存储在某个列表中

my_list = []
my_list.append(first_point)
my_list.append(second_point)

列表中的问题是它的索引与x,y属性不对应。

Dictionary / DataFrame方法:

Plane = {"x" : [first_point.x, second_point.x], "y" : [first_point.y, second_point.y], "some_reference/id_to_point_instance" = ???}
Plane_pd = pd.DataFrame(Plane)

我已经阅读过使用&#34; id&#34;实例作为DataFrame中的第三列值可能会导致垃圾收集器出现问题。

1 个答案:

答案 0 :(得分:7)

pandas.DataFrame很乐意存储python对象。

用于演示的一些测试代码......

测试代码:

class MyPoint:
    def __init__(self, x, y):
        self._x = x
        self._y = y

    @property
    def x(self):
        return self._x

    @property
    def y(self):
        return self._y

my_list = [MyPoint(1, 1), MyPoint(2, 2)]
print(my_list)

plane_pd = pd.DataFrame([[p.x, p.y, p] for p in my_list],
                        columns=list('XYO'))
print(plane_pd.dtypes)
print(plane_pd)

结果:

[<__main__.MyPoint object at 0x033D2AF0>, <__main__.MyPoint object at 0x033D2B10>]

X     int64
Y     int64
O    object
dtype: object

   X  Y                                        O
0  1  1  <__main__.MyPoint object at 0x033D2AF0>
1  2  2  <__main__.MyPoint object at 0x033D2B10>

注意:

请注意,列表中的两个对象是数据框中的两个对象。另请注意,O列的dtype为object