IBM watson检索和排名训练错误" java.util.ArrayList无法强制转换为java.lang.Float"

时间:2016-06-15 11:25:21

标签: solr ibm-watson retrieve-and-rank

我们已将IBM Watson for Worksheet中的Solr Schema定义为问题集合。很少有架构元素是多值字段。 我们可以使用检索和排名服务加载文档和索引文档,但在生成培训数据集时,我们会收到数据类型转换错误。

模式

    <field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false"/>
    <field name="worksheet_number" type="watson_text_en" indexed="true" stored="true" />
    <field name='question_number' type='int' indexed='true' stored='true' multiValued='true' />
    <field name='question_type' type='watson_text_en' indexed='true' stored='true' multiValued='true' />
    <field name='answer' type='watson_text_en' indexed='true' stored='true' multiValued='true' />
    <field name='text' type='watson_text_en' indexed='true' stored='true' multiValued='true' />

使用train.py训练命令,该命令会抛出异常     curl -u&#34; ***********&#34;:&#34; ************&#34; &#34; https://gateway.watsonplatform.net/retrieve-and-rank/api/v1/rankers/3b140ax15-rank-3108

不幸的是,一个例外并没有提供有关它抛出异常的字段的任何信息。

Java.lang.ClassCastException: java.util.ArrayList cannot be cast to java.lang.Float
  at com.ibm.watson.hector.plugins.ss.FCFeatureGeneratorComponent.toCSV(FCFeatureGeneratorComponent.java:677)
  at com.ibm.watson.hector.plugins.ss.FCFeatureGeneratorComponent.process(FCFeatureGeneratorComponent.java:364)
  at org.apache.solr.handler.component.SearchHandler.handleRequestBody(SearchHandler.java:272)
  at org.apache.solr.handler.RequestHandlerBase.handleRequest(RequestHandlerBase.java:155)
  at org.apache.solr.core.SolrCore.execute(SolrCore.java:2082)
  at org.apache.solr.servlet.HttpSolrCall.execute(HttpSolrCall.java:651)
  at org.apache.solr.servlet.HttpSolrCall.call(HttpSolrCall.java:458)
  at org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:229)
  at org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:184)
  at org.eclipse.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandler.java:1652)
  at org.eclipse.jetty.servlet.ServletHandler.doHandle(ServletHandler.java:585)
  at org.eclipse.jetty.server.handler.ScopedHandler.handle(ScopedHandler.java:143)
  at org.eclipse.jetty.security.SecurityHandler.handle(SecurityHandler.java:577)
  at org.eclipse.jetty.server.session.SessionHandler.doHandle(SessionHandler.java:223)
  at org.eclipse.jetty.server.handler.ContextHandler.doHandle(ContextHandler.java:1127)
  at org.eclipse.jetty.servlet.ServletHandler.doScope(ServletHandler.java:515)
  at org.eclipse.jetty.server.session.SessionHandler.doScope(SessionHandler.java:185)
  at org.eclipse.jetty.server.handler.ContextHandler.doScope(ContextHandler.java:1061)
  at org.eclipse.jetty.server.handler.ScopedHandler.handle(ScopedHandler.java:141)
  at org.eclipse.jetty.server.handler.ContextHandlerCollection.handle(ContextHandlerCollection.java:215)
  at org.eclipse.jetty.server.handler.HandlerCollection.handle(HandlerCollection.java:110)
  at org.eclipse.jetty.server.handler.HandlerWrapper.handle(HandlerWrapper.java:97)
  at org.eclipse.jetty.server.Server.handle(Server.java:499)
  at org.eclipse.jetty.server.HttpChannel.handle(HttpChannel.java:310)
  at org.eclipse.jetty.server.HttpConnection.onFillable(HttpConnection.java:257)
  at org.eclipse.jetty.io.AbstractConnection$2.run(AbstractConnection.java:540)
  at org.eclipse.jetty.util.thread.QueuedThreadPool.runJob(QueuedThreadPool.java:635)
  at org.eclipse.jetty.util.thread.QueuedThreadPool$3.run(QueuedThreadPool.java:555)
  at java.lang.Thread.run(Thread.java:745)\n","code":500}}

在Schema和Generating Training数据集中定义的MultiValue字段似乎存在问题。 MultiValue字段允许我们存储多个问题,给定工作表编号的文本以及任何数据类型。例如。问号的整数,在question_number字段中的值为[1,2,3,4,5]。

生成训练数据集时,Watson API会抛出异常,数据类型转换错误&#34; java.util.ArrayList无法强制转换为java.lang.Float&#34;。

1 个答案:

答案 0 :(得分:1)

这个问题可能是由于一个名为&#34;得分&#34;的多值字段造成的。在你的数据中。它可以是schema.xml中显式定义的字段,也可以是某些文档中的有效动态字段。你能检查一下是否是这种情况?如果是这样,则需要将其更改为其他名称(例如&#34; my_score&#34;),因为这会与Solr硬编码的名称冲突以返回分数。