df = pd.read_stata('file.dta')
for cols in df.columns.values:
name = cols.lower()
type = df[cols].dtype
#label = ...
我需要在每个列的python中获取标签/描述。
答案 0 :(得分:5)
在Pandas 0.22中,您还可以通过创建迭代器来访问它。即
import pandas as pd
itr = pd.read_stata('file.dta', iterator=True)
itr.variable_labels()
这将返回一个字典,其中键是变量名称,值是变量标签。我认为这比pd.io.stata.StataReader
更容易记住。
答案 1 :(得分:4)
这将返回标签字典:
>>> pd.io.stata.StataReader('file.dta').variable_labels()
{'x': 'x label', 'y': 'y label'}
答案 2 :(得分:1)
我得到了这个
reader = pd.io.stata.StataReader('file.dta')
header = reader.variable_labels()
for var in header:
name = var
label = header[name]