我很难在脑海中试图将这两个概念分开。
我知道评估指标(例如BLEU)可用于衡量给定输入相对于参考的质量(如机器翻译中)。但这个分数是否可以用于将句子分为两类?例如,具有高于0.50的特定评估度量分数的句子将被给予“是”,而低于0.50的所有句子给出“否”。
此外,这可能与机器学习算法中使用的功能有关吗?例如,假设短语“过去”是数据的一个可能特征,然后可用于将输入分类为具有此功能。
答案 0 :(得分:1)
在这里,您似乎完全忽略了基本概念的含义。
f
,它应用于您的输入对象x
返回一些值,例如 - number或0/1(有没有/有一些现象的代表。例如,这样的特征可能是(对于文本文档)“给定的文本包含过去的子字符串”,所以f("I like trains")=false (0)
和f("I liked trains in the past")=1 (true)
。你不训练分类器来检测特征,你提取它们使用一些简单(高效)的算法来表示你的数据,然后用它们将它们分类到某些类。一旦你有f
,就没有必要“将输入分类为具有这个功能”,因为{{1 完全这个。当然,实际上可以训练分类器,以便在某些数据点不可用时“填充”缺失的特征,但这是一个更高级的主题,它确实似乎不是你问题的一部分。我建议你在Andrew Ng的机器学习中观看一些精彩的介绍视频,在课程平台上可用:https://class.coursera.org/ml/lecture/preview