Question

我需要帮助来获取包含以下数据的python pandas数据框，并在文本文件中使用前两列生成节点生成决策树，并使用MULTIPLIER列包含与每个＆lt; leaf＆lt; leaf＆gt;相关联的值＃39;

import pandas as pd
d = {'device': ['mobile', 'mobile', 'mobile', 'tablet', 'tablet','tablet', 
'desktop', 'desktop', 'desktop'], 'day': ['monday', 'tuesday', 'wednesday', 
'monday', 'tuesday', 'wednesday', 'monday', 'tuesday', 'wednesday'], 
'multiplier':[2.5, 3.5, 4.5, 2, 2.4, 3, 1.5, 1.5, 1.1]}
frame = pd.DataFrame(data=d, columns=['device', 'day', 'multiplier'])    
df=frame.sort_values(['device','day'], ascending=True)
df.reset_index(drop=True, inplace=True)

包含决策树的结果.txt文件需要采用以下格式：

http://textuploader.com/dqcoe

正如您所看到的，我需要生成一个＆＃39; leaf_name＆＃39;它将由下划线分隔的组件节点名称组合在一起。

为了预先解决这个方法的问题，我特别想要一个递归解决方案，因为数据帧中的输入列数（在MULTIPLIER列之前）将来会有所不同，这反过来会改变数据中的级别数。结果树。

非常感谢任何帮助。

提前谢谢

使用Python Pandas递归生成决策树文本文件

0 个答案: