我正在尝试使用SVM灯构建分类器,该分类器将文档分类为两个类之一。我已经训练并测试了分类器,并将模型文件保存到磁盘中。现在我想使用这个模型文件来分类全新的文档。这应该是什么输入文件格式?它可能是纯文本文件(我认为不会起作用)或者可能只是文本文件中存在的功能的简单列表,没有任何类标签和功能权重(在这种情况下,我必须跟踪指数训练期间特征向量中的特征)还是其他格式?
答案 0 :(得分:7)
培训和测试文件的格式必须相同,每个实例都会产生以下形式的行:
<line> .=. <target> <feature>:<value> ... <feature>:<value> # <info>
<target> .=. +1 | -1 | 0 | <float>
<feature> .=. <integer> | "qid"
<value> .=. <float>
<info> .=. <string>
例如(从SVM ^ light网站复制面食):
-1 1:0.43 3:0.12 9284:0.2 # abcdef
有关详细信息,请参阅SVM^light website。
答案 1 :(得分:1)
进行预测的文件格式与进行测试和训练的文件格式相同,即
<p-dialog [style]="{'margin':'80px', 'overflow':'scroll'}">
但是为了预测目标是未知的,因此你必须使用0值作为目标。这是唯一的区别。我希望这有助于某人