Question

我想使用svm light进行分类。

在其网站上的示例中，文件格式为：

<line> .=. <target> <feature>:<value> <feature>:<value> ... <feature>:<value> # <info>
<target> .=. +1 | -1 | 0 | <float> 
<feature> .=. <integer> | "qid"
<value> .=. <float>
<info> .=. <string>

我无法理解这种格式。 line和value指的是什么？这是示例训练集的一部分：

1 6:0.0198403253586671 15:0.0339873732306071 29:0.0360280968798065 31:0.0378103484117687 41:0.0456787263779904 63:0.021442413608662 74:0.0813238108919922 75:0.0201048944012214 81:0.0603996615380116 142:0.0102897706466067 172:0.0777948548082322 174:0.072717200608936 179:0.054076743737027 180:0.0764456665578607 186:0.112586705083256 187:0.0925011727805475 205:0.156990770998115 229:0.0519505660963924 255:0.0923321093879611 308:0.0732972342194965 318:0.119740882706743 408:0.058414185072804 409:0.0506626198519805 465:0.0843545829662396 480:0.0729642744872502 519:0.118611296605205 664:0.112142083701314 679:0.374387819227881 720:0.0987664035972632 768:0.123975200617516 922:0.141018083523918 977:0.136393581474495 1018:0.107648758381437 1305:0.180449632267364 1581:0.141526866911118 1677:0.156124608446181 1817:0.141018083523918 2162:0.170921341813635 2314:0.164249324532582 2358:0.508349039100422 2419:0.150582824316425 3266:0.338899359400281 3374:0.166725496161846 8311:0.219691455487068

我知道在第一行数据1中引用正输出，6引用target。 target是指word。并0.0198403253586671引用value。但我不知道如何计算value:0.0198403253586671。

Answer 1

第1行：一行是目标，后跟一系列特征值对和一些注释第2行：目标是一或减一或零或浮点数第3行：一个特征是一个整数等等。它是所有可能输入的语法。

Answer 2

我使用SVMLIght进行情绪分析。 value是根据文档中术语的频率计算的。

为svm灯训练设置

2 个答案: