scikit-learn preperation

时间:2015-06-09 18:44:49

标签: python machine-learning scikit-learn

我正在尝试使用scikit-learn包进行半监督分类,我有一个包含类,实例和功能的文件,但我不知道如何为scikit-learn准备此文件。你能为文件准备提供一些指导吗?本教程仅提供从机器学习存储库上载准备好的数据集的说明。谢谢!

1 个答案:

答案 0 :(得分:0)

Scikit-learn直接支持特殊的面向学习的输入格式,特别是SVMLight。但一般来说,它的输入是一个numpy数组(密集时),它可以使用SciPy堆栈中的其他工具从各种数据源生成,特别是scipy.io,在文本的情况下更有针对性包含{,3 {}列的文件。您可以使用Pandas IO tools,然后拔出,并从功能集中删除目标类列。