我正在EC2实例上运行Python脚本,该脚本正在将序列数据从WebSocket记录到RDS。问题是这种特定的Websocket每隔几天甚至有时甚至几小时会断开一次连接,并且在重新启动连接时会丢失数据。如何解决这个问题?
我想我需要运行两个在地理位置上不同的实例来侦听WebSocket,并将所有更新推送到中央节点(或其中一个节点),或者可能通过DynamoDB。如何有效地接收,丢弃和以其他方式对同一数据流的数据进行重复数据删除?我可以在AWS上应用哪些模式?理想的解决方案可生成单个,合并,重复数据消除的近实时流。