错误未定义字段:solr上的“stream_size”

时间:2017-02-03 14:40:57

标签: database apache solr field apache-tika

我尝试在引用solr 6.3中的数据库列的字段中使用/ update / extract,但它不起作用,这个错误出现在我身上:

Status: {"data":{"responseHeader":{"status":400,"QTime":8},"error":{"metadata":["error-class","org.apache.solr.common.SolrException","root-error-class","org.apache.solr.common.SolrException"],"msg":"undefined field: \"stream_size\"","code":400}},"status":400,"config":{"method":"POST","transformRequest":[null],"transformResponse":[null],"headers":{"Content-type":"application/json","Accept":"application/json, text/plain, */*"},"data":"[]","url":"/solr/TesteSisp/update%2Fextract","params":{"wt":"json","_":1486132402860,"commitWithin":1000,"boost":"1.0","overwrite":true},"timeout":10000},"statusText":"Bad Request"}
Response:

{
  "responseHeader": {
    "status": 0,
    "QTime": 5
  }
}

有人知道我能做什么吗?

1 个答案:

答案 0 :(得分:1)

提取过程将生成一堆包含内容和元数据的字段。 Solr要求您明确说明如何处理索引过程中收到的每个字段。

你需要有一个处理它的策略。通常它是以下之一:

  1. 在架构中显式创建字段(或具有匹配的动态字段)
  2. 使用无模式模式根据首次看到的内容自动创建字段
  3. 使用fmap or uprefix将字段名称全局映射到已知字段/ dynamicFields
  4. 拥有一个动态*字段,用于存储或放弃所有与其他定义不匹配的字段名称。
  5. 您还可以在UpdateRequestProcessor链中使用字段和/或字段名称,但这更高级。