我是否正确理解pandas数据框是Series类型,而存储在数据框中的数据类型可能是数组,列表,字典等类型?是否有任何好的教程可以解释这些工作人员的例子?
答案 0 :(得分:1)
答案 1 :(得分:1)
用熊猫语来说,数据帧是Series对象的字典。所以说,每列都是一个系列。每个系列都可以包含任何类型的对象。
除了另一个答案中提到的在线资源之外,this是进入大熊猫的最佳书籍。
一些消息来源:
DataFrame是一个二维标记数据结构,其中包含可能不同类型的列。您可以将其视为电子表格或SQL表,或Series对象的字典。它通常是最常用的pandas对象。
In [4]:
import pandas as pd
d = {'one' : pd.Series([1., 2., 3.], index=['a', 'b', 'c']), 'two' : pd.Series([1., 2., 3., 4.], index=['a', 'b', 'c', 'd'])}
df = pd.DataFrame(d)
In [7]:
type(df)
Out[7]:
pandas.core.frame.DataFrame
In [8]:
type(df.one)
Out[8]:
pandas.core.series.Series