你最严重的生产错误是什么?这可能是您在实时系统中制作或解决的任何错误。
[感动我对答案的回应]
答案 0 :(得分:5)
我的第一个项目是在一个软件公司的大型销售补偿系统上。我们在最终的汇总程序中遇到了一个错误,它试图从下一个薪水中减去任何拥有的资金。在某些情况下,追溯计算增加了前一个月欠款的数额,将记录借方,然后从下一次工资支票中扣除。第一个月开始的3.23美元可能会在下个月增加到6.46美元。你可以看到它的发展方向。虽然我们很早就听到了一些用户投诉,但我们将其视为“用户错误” - 销售计划很复杂,任何人都很容易误解要支付的金额是多少。但几个月之后,失踪的钱太大而不容忽视 - 超过2,000,000美元的未支付工资单支票。代码修复很容易,经过几个月的数百名员工的工资计算,而不是那么多。
答案 1 :(得分:5)
我在一个电子商务网站上工作,客户端数据作为来自传统后端系统的CSV转储提供。我们只有一个样本数据集可以使用(尽管重复请求完整的数据集)所以我们第一次看到完整的数据是在它发布的早上在现场网站上。所有字符串都在CSV文件中引用,但数字不是。我们没有意识到遗留系统为数千个大数字插入了一个逗号 - 所以在我们预期的位置,例如1099.99,我们得到1,099.99。当然,CSV解析器看到逗号并将值取为1.想象一下,当订单开始进入大型商品时,客户会感到意外,这些商品显然以每个1英镑的低价出售。代码很快修复,幸运的是他们的条款允许他们拒绝订单。获得的经验教训:永远不要相信样本数据集,直到您使用完整数据负载进行测试后才能生效。
答案 2 :(得分:5)
我们有一个电子商务系统,当它被移动到生产服务器时(通过我们超级棒的手动复制/粘贴/编辑设置过程),高级开发人员 - 唯一一个可以访问服务器的人 - 忘了将系统连接到支付网关。后来价值18,000美元的销售额,客户注意到他们的银行账户不比我们开始时的账户大。
自那天起的流程改进:
不是一个。
我们如何解决问题:
告知客户根据他们的电子邮件通知联系所有客户
答案 3 :(得分:4)
在我建立的系统的实时更新期间,我丢失了大约7个用户的一些用户注册数据。这听起来并不是那么糟糕,只不过它注册了180亿美元的IPO。我们能够通过自动发送的电子邮件跟踪信息,但是在这个小小的打嗝上有一些汗水流下来。