我对数据库不是很有经验,可能会走上一条完全错误的轨道。
我有两个表,链接和标签,带有关联表。我想使用类似row = [tag, link]
的输入更新此数据库,但要确保我不添加任何已存在的标记或链接。因此,我首先测试链接是否存在,然后是否存在标记,最后是否存在关联。
表格如下:
tagslinks_assoc = Table(
'tagslinks', Base.metadata,
# Column('id', Integer, primary_key=True), # Not sure if this is required
Column('tagid', Integer, ForeignKey('tags.tagid')),
Column('linkid', Integer, ForeignKey('links.linkid')))
class Tags(Base):
__tablename__ = 'tags'
tagid = Column(Integer, primary_key=True)
tag = Column(String, unique=True)
links = relationship("Links", secondary=tagslinks_assoc, backref="tags")
class Links(Base):
__tablename__ = 'links'
linkid = Column(Integer, primary_key=True)
link = Column(String, unique=True)
我正在检查链接和标记是否存在如下:
link = session.query(Links).filter(Links.link == row[1]).first()
tag = session.query(Tags).filter(Tags.tag == row[0]).first()
如果标签和链接已经存在但尚未连接,我将如何更新标记和链接之间的关联?
sqlalchemy和/或数据库关系中是否有一些东西会使整个方法变得多余?
我正在处理this example以了解如何创建多对多关系,但我的字段都是唯一的。也许他们不应该?
答案 0 :(得分:1)
你几乎就在那里。默认情况下,关系类似于列表,因此只需附加项目即可创建新关联。相反,将它们设置为类似于检测重复项。集合中的东西需要覆盖__hash__
,以便正确检测重复项。
class Tags(Base):
# ...
links = relationship(
'Links', tagslinks_assoc,
collection_class=set, # use a set to hold the collection
backref=backref('tags', collection_class=set)
)
def __hash__(self):
return hash((self.__class__, self.tag)) # any Tag with the same name hashes equal
class Links(Base):
# ...
def __hash__(self):
return hash((self.__class__, self.link))
现在获取标记,并将其添加到链接中。如果它已经存在,那么什么都不会发生。
tag = session.query(Tags).filter(Tags.tag == 'my_tag').first()
link = session.query(Link).filter(Links.link == 'my_link').first()
link.tags.add(tag) # if it's already present, the hash will compare equal and nothing will happen
session.commit()
请参阅有关collection_class的文档。
关于您的tagslinks_assoc表,在大多数情况下,每个表都应该有一个主键。在这种情况下,密钥将是tagid和linkid的复合。
tagslinks_assoc = Table(
'tagslinks', Base.metadata,
Column('tagid', Integer, ForeignKey('tags.tagid'), primary_key=True),
Column('linkid', Integer, ForeignKey('links.linkid'), primary_key=True)
)