我需要帮助来获取包含以下数据的python pandas数据框,并在文本文件中使用前两列生成节点生成决策树,并使用MULTIPLIER列包含与每个< leaf< leaf>相关联的值#39;
import pandas as pd
d = {'device': ['mobile', 'mobile', 'mobile', 'tablet', 'tablet','tablet',
'desktop', 'desktop', 'desktop'], 'day': ['monday', 'tuesday', 'wednesday',
'monday', 'tuesday', 'wednesday', 'monday', 'tuesday', 'wednesday'],
'multiplier':[2.5, 3.5, 4.5, 2, 2.4, 3, 1.5, 1.5, 1.1]}
frame = pd.DataFrame(data=d, columns=['device', 'day', 'multiplier'])
df=frame.sort_values(['device','day'], ascending=True)
df.reset_index(drop=True, inplace=True)
包含决策树的结果.txt文件需要采用以下格式:
正如您所看到的,我需要生成一个' leaf_name'它将由下划线分隔的组件节点名称组合在一起。
为了预先解决这个方法的问题,我特别想要一个递归解决方案,因为数据帧中的输入列数(在MULTIPLIER列之前)将来会有所不同,这反过来会改变数据中的级别数。结果树。
非常感谢任何帮助。
提前谢谢