如何对csv文件中的所有条目进行随机森林预测?

时间:2017-09-13 15:21:12

标签: python machine-learning scikit-learn jupyter-notebook random-forest

我在一小组数据上训练了一个随机森林分类器。只有一个功能,位置'目标' 相关性'。我的代码非常简短,可以在这里找到 https://github.com/sakshamyadav/ocm_test/blob/master/Untitled.ipynb

我现在想做的是以下内容:

  • 输入任何带有'职位'
  • 列的csv文件
  • 通过我训练的随机森林算法来确定哪些相关哪些不是(1或0)
  • 删除相关为0的所有行。
  • 将结果另存为csv

另外,我很感激我的方法的任何反馈或建议,因为我对机器学习很新,并且非常有兴趣知道是否有更简单的方法来完成这项任务或者是否可以改进等等。非常感谢提前很多:)

P.S我在jupyter笔记本代码中提供的示例数据集是完全随机的,我并不打算放下任何专业。

1 个答案:

答案 0 :(得分:0)

假设代码中的变量名称:

df = pd.read_csv('file_name.csv')
df = df[rfc.predict(df['Position']) != 0]
df.to_csv('new_clean_file.csv')