我有一个需要解析到Android应用程序的feed。数据需要存储在数据库中,而且我目前在性能方面存在问题。
我需要将项目分类为类别和子类别。
我确实有类别的ID,所以这很酷。但对于子类别我不这样做。这会导致大量的字符串比较,以确保没有重复项添加到数据库。
从子类别的名称生成ID是一种好习惯吗?或者这对计算来说同样痛苦吗?
编辑:
Category A (ID 1)
Sub Category C (no ID)
Sub Category Z (no ID)
Sub Category V (no ID)
Category B (ID 7)
Sub Category O (no ID)
Sub Category C (no ID) (this is not the same Sub Category 'C' as under Category 'A')
数据如上所示。我将Category存储在一个表中,将子类存储在另一个表中,我不想添加重复项。因此,为了避免重复记录,我需要检查已存在的内容。但我没有Sub Cateogries的任何ID
答案 0 :(得分:0)
有多种方法可以解决这个问题,它实际上取决于您实际执行的插入数量。如果它不是太多,那么索引sub-cateogory列就足够了,然后在每个插入之前完成:
从sub_category_table中选择count(*),其中sub_category_field ='subCategory'
如果查询返回大于0,则可以跳过插入。
如果这在性能方面不够好,那么有助于获得有关数据和架构的更多信息。