标签数据库 - 使用唯一列更新多对多表

时间:2014-06-25 08:26:38

标签: python database-design sqlalchemy

我对数据库不是很有经验,可能会走上一条完全错误的轨道。

我有两个表,链接和标签,带有关联表。我想使用类似row = [tag, link]的输入更新此数据库,但要确保我不添加任何已存在的标记或链接。因此,我首先测试链接是否存在,然后是否存在标记,最后是否存在关联。

表格如下:

tagslinks_assoc = Table(
    'tagslinks', Base.metadata,
    # Column('id', Integer, primary_key=True),  # Not sure if this is required
    Column('tagid', Integer, ForeignKey('tags.tagid')),
    Column('linkid', Integer, ForeignKey('links.linkid')))

class Tags(Base):
    __tablename__ = 'tags'    
    tagid = Column(Integer, primary_key=True)
    tag   = Column(String, unique=True)
    links = relationship("Links", secondary=tagslinks_assoc, backref="tags")

class Links(Base):
    __tablename__ = 'links'    
    linkid    = Column(Integer, primary_key=True)
    link      = Column(String, unique=True)

我正在检查链接和标记是否存在如下:

link = session.query(Links).filter(Links.link == row[1]).first()
tag = session.query(Tags).filter(Tags.tag == row[0]).first()

如果标签和链接已经存在但尚未连接,我将如何更新标记和链接之间的关联?

sqlalchemy和/或数据库关系中是否有一些东西会使整个方法变得多余?

我正在处理this example以了解如何创建多对多关系,但我的字段都是唯一的。也许他们不应该?

1 个答案:

答案 0 :(得分:1)

你几乎就在那里。默认情况下,关系类似于列表,因此只需附加项目即可创建新关联。相反,将它们设置为类似于检测重复项。集合中的东西需要覆盖__hash__,以便正确检测重复项。

class Tags(Base):
    # ...

    links = relationship(
        'Links', tagslinks_assoc,
        collection_class=set,  # use a set to hold the collection
        backref=backref('tags', collection_class=set)
    )

    def __hash__(self):
        return hash((self.__class__, self.tag))  # any Tag with the same name hashes equal

class Links(Base):
    # ...

    def __hash__(self):
        return hash((self.__class__, self.link))

现在获取标记,并将其添加到链接中。如果它已经存在,那么什么都不会发生。

tag = session.query(Tags).filter(Tags.tag == 'my_tag').first()
link = session.query(Link).filter(Links.link == 'my_link').first()

link.tags.add(tag)  # if it's already present, the hash will compare equal and nothing will happen
session.commit()

请参阅有关collection_class的文档。

关于您的tagslinks_assoc表,在大多数情况下,每个表都应该有一个主键。在这种情况下,密钥将是tagid和linkid的复合。

tagslinks_assoc = Table(
    'tagslinks', Base.metadata,
    Column('tagid', Integer, ForeignKey('tags.tagid'), primary_key=True),
    Column('linkid', Integer, ForeignKey('links.linkid'), primary_key=True)
)