我有一个数据集,有必要将时间戳增加十亿分之一秒,以避免将我的观点视为重复。 (来自documentation的建议)
检查数据库中是否已经存在带有特定标签集和时间戳的点的最佳方法是什么?
此刻我是这样的:
def duplicate_point(influxdb_client, influxdb_point):
q = "SELECT * FROM random_measurement WHERE time={} AND mac='{}'".format(
influxdb_point['time'],
influxdb_point['tags']['mac']
)
result = influxdb_client.query(q)
return bool(result)
如果结果不为空,则给定点为重复项。当发现重复项时,会将纳秒添加到时间戳中。每当将点写入数据库时,我都会执行此检查,但是这会对吞吐量产生巨大影响。是否存在解决此问题的更好方法?