在python中为分类问题生成综合数据的正确开始

时间:2019-06-19 08:46:31

标签: python data-science synthetic

我有一个包含9个要素和1300行的数据集。我试图在我拥有的当前数据上生成综合数据。输出分为2个选项。即1和0,即(1-是和0-否),这里的问题是几乎1100个案例的输出为“ 0”,而200个案例的输出为“ 1”。以前,我尝试过训练,但效果并不理想。我的教授建议我处理综合数据,并增加输出“ 1”的用例,以帮助开发机器学习模型。我对合成数据一无所知。我承认。我只是不知道从哪里开始。有人可以帮忙吗?如何解决这类问题。任何建议表示赞赏?任何参考代码对于学习目的都是有用的。 谢谢

1 个答案:

答案 0 :(得分:0)

据我了解,您需要使用数据增强。

看看this和/或this

您将能够大大增加数据集的大小,并有可能提高您的训练准确性。

类似于以下内容: Something similar to this