大家好,我正在尝试定义一组变量,并且我想格式化其名称。
设置为:
features=['Gender','Age','Rank'] + other11columns #selected columns of my data
In [1]:data['Gender'].unique()
Out[1]: array([0, 1], dtype=int64)
In [2]:data['Age'].unique()
Out[2]: array([10, 20, 30, 40, 50], dtype=int64)
In [3]:data['Rank'].unique()
Out[3]: array([0, 1, 2, 3, 4, 5, 6], dtype=int64)
.....
首先,我想为每个标签设置一些空的数据框。我想要这样的东西:
report_Gender
Out[3]:
Prediction Actual
0 NaN NaN
1 NaN NaN
report_Age
Out[5]:
Prediction Actual
10 NaN NaN
20 NaN NaN
30 NaN NaN
40 NaN NaN
50 NaN NaN
report_Rank
Out[6]:
Prediction Actual
0 NaN NaN
1 NaN NaN
2 NaN NaN
3 NaN NaN
4 NaN NaN
5 NaN NaN
6 NaN NaN
.......
以下代码不起作用,但指示了我要做什么
for i in range(len(features)-1):
report_features[i]=pd.DataFrame(index=data[feature[i]].unique(),columns=['Prediction','Actual'])
我试图通过%s操作来处理字符串格式,但没有弄清楚如何输入变量的名称...感谢您的帮助:)
答案 0 :(得分:1)
动态创建全局变量可能会很麻烦。如果将其放在较小的范围内==>任何对象(例如字典),则容易得多。您可以像这样实现您想要的
my_dictionary = dict()
for f in features:
my_dictionary['report_{}'.format(f)] = pd.DataFrame(index=data[f].unique(),columns=['Prediction','Actual'])
例如,您可以像my_dictionary['report_Gender']
一样访问df。
另一种方法是创建一个类:
class Reports:
pass
for f in features:
setattr(Reports, 'report_{}'.format(f), pd.DataFrame(index=data[f].unique(),columns=['Prediction','Actual'])
然后以Reports.report_Gender
等身份访问...
答案 1 :(得分:0)
如果您确实不想这样做,可以使用setattr方法,但我建议遵循Ravi Patel的建议
for i in range(len(features)-1):
setattr(object_method_or_module_your_variable_belong,
name_for_you_varialbe,
pd.DataFrame(index=data[feature[i]].unique(),columns=['Prediction','Actual'])