有没有办法在python中读取Stata标签?

时间:2017-06-28 18:08:15

标签: python pandas stata

df = pd.read_stata('file.dta')
for cols in df.columns.values:
    name = cols.lower()
    type = df[cols].dtype
    #label = ...

我需要在每个列的python中获取标签/描述。

3 个答案:

答案 0 :(得分:5)

在Pandas 0.22中,您还可以通过创建迭代器来访问它。即

import pandas as pd
itr = pd.read_stata('file.dta', iterator=True)
itr.variable_labels()

这将返回一个字典,其中键是变量名称,值是变量标签。我认为这比pd.io.stata.StataReader更容易记住。

答案 1 :(得分:4)

这将返回标签字典:

>>> pd.io.stata.StataReader('file.dta').variable_labels()
{'x': 'x label', 'y': 'y label'}

答案 2 :(得分:1)

我得到了这个

reader = pd.io.stata.StataReader('file.dta')
header = reader.variable_labels()
for var in header:
    name = var
    label = header[name]