我想使用svm light进行分类。
在其网站上的示例中,文件格式为:
<line> .=. <target> <feature>:<value> <feature>:<value> ... <feature>:<value> # <info>
<target> .=. +1 | -1 | 0 | <float>
<feature> .=. <integer> | "qid"
<value> .=. <float>
<info> .=. <string>
我无法理解这种格式。 line
和value
指的是什么?
这是示例训练集的一部分:
1 6:0.0198403253586671 15:0.0339873732306071 29:0.0360280968798065 31:0.0378103484117687 41:0.0456787263779904 63:0.021442413608662 74:0.0813238108919922 75:0.0201048944012214 81:0.0603996615380116 142:0.0102897706466067 172:0.0777948548082322 174:0.072717200608936 179:0.054076743737027 180:0.0764456665578607 186:0.112586705083256 187:0.0925011727805475 205:0.156990770998115 229:0.0519505660963924 255:0.0923321093879611 308:0.0732972342194965 318:0.119740882706743 408:0.058414185072804 409:0.0506626198519805 465:0.0843545829662396 480:0.0729642744872502 519:0.118611296605205 664:0.112142083701314 679:0.374387819227881 720:0.0987664035972632 768:0.123975200617516 922:0.141018083523918 977:0.136393581474495 1018:0.107648758381437 1305:0.180449632267364 1581:0.141526866911118 1677:0.156124608446181 1817:0.141018083523918 2162:0.170921341813635 2314:0.164249324532582 2358:0.508349039100422 2419:0.150582824316425 3266:0.338899359400281 3374:0.166725496161846 8311:0.219691455487068
我知道在第一行数据1
中引用正输出,6
引用target
。 target
是指word
。并0.0198403253586671
引用value
。但我不知道如何计算value:0.0198403253586671
。
答案 0 :(得分:0)
第1行:一行是目标,后跟一系列特征值对和一些注释 第2行:目标是一或减一或零或浮点数 第3行:一个特征是一个整数 等等。它是所有可能输入的语法。
答案 1 :(得分:0)
我使用SVMLIght进行情绪分析。 value
是根据文档中术语的频率计算的。