我正在尝试使用scikit-learn
包进行半监督分类,我有一个包含类,实例和功能的文件,但我不知道如何为scikit-learn
准备此文件。你能为文件准备提供一些指导吗?本教程仅提供从机器学习存储库上载准备好的数据集的说明。谢谢!
答案 0 :(得分:0)
Scikit-learn直接支持特殊的面向学习的输入格式,特别是SVMLight。但一般来说,它的输入是一个numpy数组(密集时),它可以使用SciPy堆栈中的其他工具从各种数据源生成,特别是scipy.io,在文本的情况下更有针对性包含{,3 {}列的文件。您可以使用Pandas IO tools,然后拔出,并从功能集中删除目标类列。