使用AutoML评估算法Word2Vec的超参数

时间:2019-03-26 14:35:56

标签: word2vec h2o hyperparameters

使用AutoML(来自H2O)是否可以仅使用Word2Vec算法并尝试不同的参数值,以找出哪些参数设置为我的数据集提供了最准确的矢量?因此,我不希望AutoML将算法DeepLearning,GBM等应用于我的数据集。只有Word2Vec算法...我该怎么做?

到目前为止,我只设法用H2O建立了word2vec模型。

我想用AutoML测试Word2Vec的超参数的不同设置,以评估哪种设置是最佳的...

1 个答案:

答案 0 :(得分:0)

Word2Vec算法是一种数据转换算法(将文本行转换为矩阵),而不是监督式机器学习算法(这是AutoML及其内部所有算法的作用)。

使用Word2Vec的典型方式是将Word2Vec应用于文本数据,以便您的数据可用于训练监督的ML算法。在这里,您可以在此转换后的数据集上运行任何监督算法(GLM,Random Forest,GBM等),或者我的建议是仅将转换后的数据传递给AutoML,以便为您找到最佳算法。

鉴于要应用到问题的某些特殊的监督学习算法,您将不得不手动尝试Word2Vec的不同设置,并查看它们的效果如何。希望这可以消除混乱。