我正在定义一个XML模式,该模式将包含将被重新导入Solr进行处理的搜索查询信息。我想为查询结果保存的一个方面是它们是否被访问过,如果是,那么多长时间。现在我想知道如何最好地在我的结构中定义这些数据,我可以使用'result'元素的属性,或者我可以添加一个可选的子元素来保存点击的所有信息。
使用属性:
<result index="1" clicked="true">
<timeViewed>45.21</timeViewed>
<title>Alpha</title>
</result>
<result index="2" clicked="false">
<title>Beta</title>
</result>
使用子元素:
<result index="1">
<clickInfo timeViewed="45.21"/>
<title>Alpha</title>
</result>
<result index="2">
<title>Beta</title>
</result>
最后,根据this question:
<result index="1">
<clicked timeViewed="45.21">true</clicked>
<title>Alpha</title>
</result>
<result index="2">
<clicked>false</clicked>
<title>Beta</title>
</result>
由于我将大量的这些XML文件索引到Solr和MongoDB,我想知道最有效的结构是什么。在将信息加载到数据库或索引之前,这些差异是否会对转换过程产生明显影响?
答案 0 :(得分:1)
我个人会去找属性,理由是