我有80000个问题和答案,使用Solr索引,以及一个功能文件。 我试图为每个Q& A夫妇提取这些功能值,以便通过算法(例如LambdaMart)将它们用于训练。
训练算法以此格式输入:
<label> qid:<qid> <feature>:<value> ... <feature>:<value> # <info>
例如:
3 qid:1 1:1 2:1 3:0 4:0.2 5:0 # 1A
2 qid:1 1:0 2:0 3:1 4:0.1 5:1 # 1B
1 qid:1 1:0 2:1 3:0 4:0.4 5:0 # 1C
1 qid:1 1:0 2:0 3:1 4:0.3 5:0 # 1D
1 qid:2 1:0 2:0 3:1 4:0.2 5:0 # 2A
有人可以帮我提取这些功能值吗? 谢谢!