在Cassandra中创建的记录如果有一个甚至没有索引的Map列,就不会被索引到Solr中

时间:2017-07-07 19:44:15

标签: solr cassandra datastax-enterprise cql3 datastax-search

我有一个DSE Cassandra表,其中有一列冻结<地图<文本,文本>> 即可。当我尝试在DSE Search Solr中索引表时,我没有索引上面的Map列。具有NULL Frozen<的记录地图<文本,文本>在Solr中编入索引,而具有VALUE的索引不会被编入索引。

根据DSE搜索文档,Indexing frozen maps is not supported

但是,我根本没有对冻结列编制索引(请参阅下面的schema.xml)。它就在C *表中。

以下是重现问题的步骤,

创建Keyspace

cqlsh> CREATE KEYSPACE arun 
          WITH REPLICATION = { 
            'class' : 'SimpleStrategy', 
            'replication_factor' : 1 };

cqlsh> use arun

创建Cassandra表

cqlsh:arun> create table employee ( 
             emp_id int, 
             emp_name string, 
             emp_dept string, 
             emp_dob string, 
             unique_identifier frozen<map<text, text>>, 
             primary key (emp_id, emp_name));

创建了Solr Core

$./dsetool create_core arun.employee generateResources=true coreOptionsInline=include_columns:emp_id,emp_name,emp_dept

自动生成:schema.xml

<schema name="autoSolrSchema" version="1.5">
  <types>
    <fieldType class="org.apache.solr.schema.TrieIntField" name="TrieIntField"/>
    <fieldType class="org.apache.solr.schema.TextField" name="TextField">
      <analyzer>
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="solr.LowerCaseFilterFactory"/>
      </analyzer>
    </fieldType>
    <fieldType class="org.apache.solr.schema.StrField" name="StrField"/>
  </types>
  <fields>
    <field docValues="true" indexed="true" multiValued="false" name="emp_id" stored="true" type="TrieIntField"/>
    <field indexed="true" multiValued="false" name="emp_dept" stored="true" type="TextField"/>
    <field indexed="true" multiValued="false" name="emp_name" stored="true" type="StrField"/>
  </fields>
  <uniqueKey>(emp_id,emp_name)</uniqueKey>
</schema>

将记录插入Cassandra表

cqlsh> insert into arun.employee 
(emp_id, emp_name, emp_dept, emp_dob) values 
(1,'arun chan','et','19790101',
      {'emp_dept': 'et', 'emp_id': '1', 'emp_name': 'arun chan'});

cqlsh> insert into arun.employee 
(emp_id, emp_name, emp_dept, emp_dob) values 
(2,'mritula chan','ml','19840101');

cqlsh> insert into arun.employee 
(emp_id, emp_name, emp_dept, emp_dob, unique_identifier) values
(3,'jaya guru','ph','19870101', 
      {'emp_id' : '3', 'emp_name' : 'jaya guru', 'emp_dept' : 'ph'});

Cassandra查询:返回3行插入

cqlsh> select * from arun.employee;

 emp_id | emp_name     | emp_dept | emp_dob  | solr_query | unique_identifier
--------+--------------+----------+----------+------------+------------------------------------------------------------
      1 |    arun chan |       et | 19790101 |       null | {'emp_dept': 'et', 'emp_id': '1', 'emp_name': 'arun chan'}
      2 | mritula chan |       ml | 19840101 |       null |                                                       null
      3 |    jaya guru |       ph | 19870101 |       null | {'emp_dept': 'ph', 'emp_id': '3', 'emp_name': 'jaya guru'}

(3 rows)
  

问题:为什么DSE Solr查询只返回一个?

cqlsh> select json * from arun.employee where solr_query = '{"q":"*:*"}';

 [json]
-----------------------------------------------------------------------------------------------------------------------------------
 {"emp_id": 2, "emp_name": "mritula chan", "emp_dept": "ml", "emp_dob": "19840101", "solr_query": null, "unique_identifier": null}

(1 rows)

1 个答案:

答案 0 :(得分:0)

Datastax支持称这是一个已知问题。

以下是其内部缺陷跟踪编号

  

DSP-13997:非索引冻结地图静默错误