我正在观看maxent分类器上的coursera NLP video。在视频中,克里斯托弗·曼宁根据他们挑选出一些课程的强度来分配lambdas。例如,曼宁说(~2:00)特征="前进的单词是,并且单词是大写的#34; (例如在魁北克省)很可能选择一个班级位置,因此给出1.8的正重量 - 但这个特征="字有一个重点"得到-.4的权重,因为在美式英语中,它更有可能选出名字而不是地方。 Manning然后说(~4:21)"感知器算法"和#34;支持向量机"有时用来挑选特征的权重 - 在他继续显示一个规范化特征权重的最大模型之前。然而,在他的最大例子中,曼宁仍然使用他刚刚在视频的第2分钟左右选出的lambdas。这些lambas来自哪里? nlp从业者是否只是从领域知识中挑选出来(如Manning所做的那样),然后用它们思考,直到算法出现正确的值?有更系统的方法吗?我是否误解了本视频中发生的事情?
答案 0 :(得分:2)
该视频主要是关于如何制定最大模型。要查找lambda的实际值,可以根据训练数据向学习系统提出优化问题。后续视频section 8.6显示了如何解决该优化问题以找到正确的权重。