上传大型文件大小为2.4 MB且包含200页时,会收到此错误

时间:2017-01-11 07:30:40

标签: ruby-on-rails solr fedora-commons

RSolr :: Error :: Http - 400 Bad Request 错误:'将文档id jd472w44j写入索引的异常;可能的分析错误:文档在字段中包含至少一个巨大的术语=“建议”(其UTF8编码长于最大长度32766),所有这些都被跳过。请更正分析仪以不生成此类条款。第一个巨大术语的前缀是:\'[10,114,116,105,-62,-80,49,52,32,9,32,49,49,48,49,49,49,49, 49,102,105,108,108,105,108,105,108,108,32,49] ...... \',原始消息:字节长度最多为32766;得到36558.也许该文档有一个索引字符串字段(solr.StrField)太大','code'=> 400}}

2 个答案:

答案 0 :(得分:1)

它表示您的一个术语("单词")大于32KB。导致此错误的常见原因是您要将全文添加到StrField或使用带有不会分割单词的标记生成器的TextField(例如KeywordTokenizer)。

检查您的架构以查看哪些字段处理大部分文本。确保它是TextField并且它具有适合的标记器。 ASCII 32是空格,它出现在您粘贴的术语前缀中,因此WhiteSpaceTokenizer可能就是您所需要的。

答案 1 :(得分:0)

因为您的文档的字段值大于lucene限制。 check this

更改架构文件中的字段类型