我想将Solr用作已发布的Tridion内容的客户端搜索引擎。它可能是作为与主应用程序断开连接的RESTful服务完成的。
由于我们几乎肯定会使用样板DD4T,其中所有内容都发布到Broker,我有一些担心,特别是在索引PDF或Word文件等二进制文件时 - 听起来像数据库可能会有很大的压力?
建议采用什么策略来检索二进制文件并以这种方式索引它们?听起来比我们在数据库外部有二进制项目更困难吗?
答案 0 :(得分:4)
我们决定将二进制文件发布到文件系统 - 您只需在cd_storage_conf.xml中使用以下内容进行配置:
<Publication Id="9" defaultStorageId="defaultdb" cached="true">
<Item typeMapping="Binary" storageId="defaultFile" cached="true"/>
</Publication>
但是,即使您确实选择将二进制文件发布到数据库,这也不会影响您的Solr索引,该索引将完全独立于代理数据库。您需要编写一些自定义(Custom Deployer?),将您的数据推送到Solr索引中,然后您可以选择忽略二进制文件。