我有一个大型(超过600,000条记录)数据库作为Django应用程序的一部分。该应用程序存储从各种开放数据Web服务收集的信息。每隔一段时间(可能每周一次或更少),我需要检查这些Web服务,看看是否有任何数据已更新。
我已经编写了一个python脚本来执行此操作。它工作正常,但它很慢,我经常在它完成之前得到这个错误:ConnectionError:[Errno 104]连接由同行重置
根据一些实验,我认为这个过程需要几天才能完成。除了优化我的脚本,处理这种长时间运行的python进程的最佳方法是什么?