我正在尝试使用支持向量机运行Grid Search,但是这花了很多时间。我的数据集很大(大约200.000行和35列)。我之前几次运行过类似的代码,但是使用rbf内核,每次调试大约需要30分钟。我现在让它运行了几个小时,但是我没有得到任何有用的输出,而且似乎冻结了。
我正在使用Jupyter笔记本,python 3.7和macOS上运行。
我已经尝试关闭所有其他打开的选项卡,重新启动Anaconda并重新启动笔记本电脑,但这无济于事。我看过我的活动监视器,它说我只使用了8 GB中的6 GB。
* update:我现在已经尝试在Spyder中运行它,但它仍将永远存在。我也尝试过使用不同的C值,但是似乎卡在了C = 10处。
这是我的代码:
tuned_parameters_lin = [{'kernel': ['linear'],
'C': [10]}]
clf_lin_dv = GridSearchCV(svm.SVC(cache_size = 400), tuned_parameters_lin, cv=3,
scoring = 'accuracy', n_jobs = -1, verbose = 5)
clf_lin_dv.fit(X_train_dv, y_train_dv)
输出: 将3个候选者中的每一个拟合3折,总计9个拟合
[CV] C = 10,核=线性..................................... .....
[CV] C = 10,核=线性..................................... .....
[CV] C = 10,核=线性..................................... .....
我正在等待任何准确性结果,但是什么都没有出现。
有人知道这是怎么回事吗?
谢谢!