我有一个简短的文字(电子邮件的主题行),我有一个值,表示成功(人们打开该电子邮件)。
将数据提供给机器学习实验以生成预测性实验以对未来文本进行评分的最佳流程和算法是什么?
答案 0 :(得分:0)
首先,您应该将文本信息转换为特征空间,而不是使用任何合适的机器学习算法来构建分类器。
恕我直言,从文本中计算特征的最佳算法是来自Google的Word2Vec https://en.wikipedia.org/wiki/Word2vec。
答案 1 :(得分:0)
Azure ML具有用于特征化的内置文本模块。你应该看的是Proprocess Text和N-gram Featuerizer。