使用决策树或读取表格CSV和熊猫的最佳方法?

时间:2019-07-01 14:31:21

标签: python-3.x pandas machine-learning

我有一个带有445行数据的CSV和一个我需要根据CSV数据预测或想要的变量,问题是我只需要输出存在于CSV文件中的该变量的其他输入,我就需要输出为none或0

例如:

Time,Call,Status,Tag,star
55,C,1,0,0     
110,C,1,0,0    
165,R,1,0,0
220,C,1,0,0

在上面的示例中,输入可以是两种类型 1. [55,C,1,0,0]和2。[55,1,0,0]

对于第一种情况,如果此行以CSV格式出现,我想要是或否,否则为0

对于第二种情况,如果此行以CSV格式出现,则我希望C或R作为输出,否则为0或无。

应用了两种方法

1。 CSV解析,在该解析中,我根据输入(例如[55,1,0,0])找到特定的单元格,如果此组合匹配,我将从CSV返回该单元格的值。它可以完全正常工作,但是问题是当我在烧瓶中制作API时,需要花费很多时间来响应。我需要快速回复

2。 在第二种方法中,我基于CSV文件创建了决策树,并且哪个叶子节点或输出是C或R。 它可以正常工作,但是决策树的问题在于它可以预测任何序列的输出,而我不需要的概率为1。我可以建立一个只能对现有数据进行预测,否则不能为0的决策吗?

对于第一种方法,我使用熊猫读取CSV并在单元格中遍历 对于第二种方法,我制作了决策树

建议我以最好的方式获得快速而准确的输出

0 个答案:

没有答案