python字符串格式化列表中变量的名称

时间:2018-10-05 16:54:17

标签: python pandas string-formatting

大家好,我正在尝试定义一组变量,并且我想格式化其名称。

设置为:

features=['Gender','Age','Rank'] + other11columns #selected columns of my data

    In [1]:data['Gender'].unique()
    Out[1]: array([0, 1], dtype=int64)

    In [2]:data['Age'].unique()
    Out[2]: array([10, 20, 30, 40, 50], dtype=int64)

    In [3]:data['Rank'].unique()
    Out[3]: array([0, 1, 2, 3, 4, 5, 6], dtype=int64)

    .....

首先,我想为每个标签设置一些空的数据框。我想要这样的东西:

report_Gender
Out[3]: 
  Prediction Actual
0        NaN    NaN
1        NaN    NaN

report_Age
Out[5]: 
  Prediction Actual
10        NaN    NaN
20        NaN    NaN
30        NaN    NaN
40        NaN    NaN
50        NaN    NaN

report_Rank
Out[6]: 
  Prediction Actual
0        NaN    NaN
1        NaN    NaN
2        NaN    NaN
3        NaN    NaN
4        NaN    NaN
5        NaN    NaN
6        NaN    NaN

....... 

以下代码不起作用,但指示了我要做什么

for i in range(len(features)-1):
    report_features[i]=pd.DataFrame(index=data[feature[i]].unique(),columns=['Prediction','Actual'])

我试图通过%s操作来处理字符串格式,但没有弄清楚如何输入变量的名称...感谢您的帮助:)

2 个答案:

答案 0 :(得分:1)

动态创建全局变量可能会很麻烦。如果将其放在较小的范围内==>任何对象(例如字典),则容易得多。您可以像这样实现您想要的

my_dictionary = dict()
for f in features:
    my_dictionary['report_{}'.format(f)] = pd.DataFrame(index=data[f].unique(),columns=['Prediction','Actual'])

例如,您可以像my_dictionary['report_Gender']一样访问df。

另一种方法是创建一个类:

class Reports:
    pass

for f in features:
    setattr(Reports, 'report_{}'.format(f), pd.DataFrame(index=data[f].unique(),columns=['Prediction','Actual'])

然后以Reports.report_Gender等身份访问...

答案 1 :(得分:0)

如果您确实不想这样做,可以使用setattr方法,但我建议遵循Ravi Patel的建议

for i in range(len(features)-1):
    setattr(object_method_or_module_your_variable_belong,
            name_for_you_varialbe,
            pd.DataFrame(index=data[feature[i]].unique(),columns=['Prediction','Actual'])