我正在尝试将元信息添加到熊猫数据框的每一列。例如,我导入这样的测量数据:
columns = ['Relative_Pressure','Volume_STP']
df = pd.read_csv(StringIO(contents), skiprows=4, delim_whitespace=True,index_col=False,header=None)
df.columns = columns
df.drop(df.index[-1], inplace=True)
其中contents
是csv格式的字符串。这会导致熊猫数据框看起来像像这样:
现在,我想为数据帧的每一列添加相应的单位,也许还需要附加说明。
我看到了this answer,并试图像这样实现它:
df['Relative_Pressure'].unit = '-'
df['Relative_Pressure'].descr = 'p/p0'
df['Volume_STP'].unit = 'ccm/g'
df['Volume_STP'].descr = 'Additional info'
但是,这似乎丝毫没有改变Dataframe。当我再次打印时,它看起来和以前完全一样。
将元数据添加到数据框的列的正确方法是什么,或者如果我正确添加了元数据,如何显示它?
编辑:here显示的内容与我想要实现的非常相似,但是我不确定如何导入数据然后添加变量名称行。