我正在寻找关于如何处理我的问题的一些指示..我在ML8.0中创建了一个内容存储库,其中存储了文件。当文件上传到数据库时,我有自定义cpf,它创建工件文件(一个提取文本,另一个xml文件,它是输入文件的注释)和一个主文件(XML),它引用了上传的原始文件和提取的文件带注释的文件)。
主文件也包含其他信息,例如<type/>
和<source/>
标记。我能够创建一个自定义搜索端点,当搜索只返回主文档时,即使搜索命中是在工件文档中也是如此。
我的困境是,我想为<source/>
标签和<type/>
标签添加分面,并且还希望为带注释的文档中的某些标签添加分面。因此,如果搜索同时检测主文档和一个或多个工件文档,则构面应仅视为源标记中的1个匹配和源标记内的相应类型。
我希望我没有混淆,我正在寻找一些指示......也许这个图可能有助于理解我的问题..这是一个样本,但我有1000个文件
答案 0 :(得分:4)
我不清楚具体细节,但一般来说,分面是从索引开始的,这对于大规模的表现来说是必要的。
您应该实现索引直接反映在搜索目标文档中的内容,而不是尝试动态解析构面的引用。
也就是说,作为工作流程的一部分,生成要查找的文档和方面。您还可以考虑为工作流文档创建不同的数据库或使用不同的词汇表,这样您就不需要自定义搜索端点来隐藏它们。
希望有帮助,
答案 1 :(得分:1)
听起来你想在<source>
上有一个方面,然后对于每个源方面值,一种深入到<type>
的源值。您可以使用两个彼此相邻的普通构面,只要从源中选择特定值,类型构面就会显示向下钻取部分。
你也可以尝试在源和类型的组合上利用元组,但这需要在服务器端和客户端进行一些手动工作..
HTH!