如何使用单个solr实例或Solr Template字段无法正常工作来索引和搜索位于同一数据源中的两个不同表

时间:2014-03-20 13:13:50

标签: xml solr indexing dataimporthandler data-import

我想索引并搜索两个不同的实体。

文件名: db-data-config.xml

<dataConfig>
    <dataSource name="myindex" driver="com.microsoft.sqlserver.jdbc.SQLServerDriver" url="jdbc:sqlserver://test-pc:1433;DatabaseName=SampleDB" user="username" password="password" />
    <document>


     <entity name="Employees" query="select * from employee" transformer="TemplateTransformer" dataSource="myindex">
            <field column="id" name="singlekey" />
            <field column="eId" name="eid" />
            <field column="eName" name="ename" />
            <field column="entity" template="Employee" name="entity" />
    </entity>

    <entity name="Products" query="select * from products" transformer="TemplateTransformer" dataSource="myindex">
            <field column="id" name="singlekey" />
            <field column="pId" name="pid" />
            <field column="pName" name="pname" />
            <field column="entity" template="Product" name="entity" />
    </entity>

</document>

文件名: schema.xml

<?xml version="1.0" encoding="UTF-8" ?>
<schema name="db" version="1.1">
  <types>
    <fieldType name="string" class="solr.StrField" sortMissingLast="true" omitNorms="true"/>
 </types>
 <fields>

    <!-- Employee -->
    <field name="eid" type="string" indexed="true" stored="true" required="true" multiValued="false" /> 
    <field name="ename" type="string" indexed="true" stored="true" required="true" multiValued="false" /> 

    <!-- Products -->
    <field name="pid" type="string" indexed="true" stored="true" required="true" multiValued="false" />
    <field name="pname" type="string" indexed="true" stored="true" required="true" multiValued="false" />

    <!--Common fields-->
    <field name="entity" type="string" indexed="true" stored="true" required="true" multiValued="false" />
    <field name="singlekey" type="string" indexed="true" stored="true" required="true" multiValued="false" />
</fields>
<uniqueKey>singlekey</uniqueKey>
</schema>

根据以下链接:
https://stackoverflow.com/questions/5636209/how-to-index-and-search-two-different-tables-which-are-in-same-datasource-using
这个问题可以通过使用静态字段来解决(添加新字段 - 这里是&#39; entity&#39; )。 但是我看到在添加第二个实体之后,它甚至无法索引数据。

如下图所示。Multiple entity issue - Template Transformer issue

它能够从sql server数据库获取10条记录,但索引0行,意味着没有完成索引过程。 所以即使无法搜索。 有谁能解决这个问题? 提前谢谢。

2 个答案:

答案 0 :(得分:1)

架构中的所有字段都有

required="true".

您告诉Solr每个实体的结果需要包含所有eid,ename,pid,pname,entity和singlekey字段。

员工没有pid或pname字段,因此不应该要求pid和pname。同样,产品没有eid或ename字段,因此不需要eid和ename。

删除

required="true".
来自pid,pname,eid和ename的

将允许您索引。

答案 1 :(得分:-2)

您是否尝试过从管理屏幕单独索引实体

http://<hostname>:<portnum>/solr