经过几周试图解决这个问题后,我来到这里,并需要新的方向来探索
我们有一组围绕vagrant的脚本,可以在AWS上使用我们的产品创建机器
要测试这些脚本以及我们支持的不同选项,我们有一个Perl脚本,可以创建并运行大量的计算机并测试它们 这是每晚执行的,可以创建多达85台机器进行测试 现在它正在为所有机器做好准备,然后测试所有机器并销毁所有机器
但是我们遇到的问题是,我们很少有机器卡在上面,有时会提供 它们可能会陷入进程的随机部分 每次我们让不同的机器卡住,当你尝试手动运行它们时,它们都可以正常工作
我们可以看到ruby进程卡在50%的CPU上并且非常慢,并且可以将其余的机器释放出来 如果您尝试只运行其中一台机器,那么它可以正常工作
当我们尝试使用较少数量的机器时,仍有一些人遇到此问题 我们尝试从win2012到2008年,同样 CPU使用率很高,但在内存或网络上却没有那么多
我们试着玩延迟和并行运行vms的数量,试图解决这个问题 但我宁愿弄清楚瓶颈是什么,并修复它继续前进
我唯一的线索是vagrant global-status命令,它向我展示了很多准备状态不再存在的机器 最新的卡住目标位于底部
我们仍然与流浪汉合作1.7.4 使用以下插件:
- winrm-fs (0.2.2)
- Version Constraint: 0.2.2 vagrant-aws (0.6.0)
- Version Constraint: 0.6.0 vagrant-omnibus (1.4.1)
- Version Constraint: 1.4.1 vagrant-serverspec (1.1.0)
- Version Constraint: 1.1.0 vagrant-share (1.1.5, system) vagrant-winrm-syncedfolders (1.0.0)
- Version Constraint: 1.0.0
我们正在寻找关于什么可以阻止流浪汉及其红宝石翻译过程的任何建议 Amazone可以阻止一些流量吗?或Windows限制? 先谢谢