我写了一段python代码,可以从博彩公司的网站上搜集赛马的几率。我现在想:
随着比赛越来越近,在规定的越来越频繁的时间内运行代码。
将刮下的数据存储在适合R中的提取和统计分析的数据库中。
道歉,如果问题措辞不清楚/解释 - 我完全是自学成才,所以没有正式的计算机科学培训。我不知道如何告诉一段python代码每隔n分钟运行一次,我也不知道如何正确地建立这样的数据库或我应该考虑哪些因素。有人能指出我正确的方向开始上面的?
答案 0 :(得分:0)
在Windows中,您可以使用任务计划程序或Linux crontab。您可以将它们配置为在设定的时间间隔内使用脚本运行python。通过这种方式,您不会持续运行python脚本,从而防止单个调用中的某些挂起会影响所有后续尝试刮取或存储在数据库中。
要存储数据,有许多选项可以是平面文件(写入文本文件),另存为python二进制文件(使用shelf或pickle),或者安装像MySQL或PostgreSQL这样的实际数据库等等。谷歌的信息。此外,像SQLAlchemy这样的ORM可以更轻松地控制,查询和更新数据库,因为它将所有表作为对象处理并创建SQL本身,因此您不需要将所有查询编码为字符串。