我的要求是我有一个应用程序,该应用程序将提供 5qps 。如果最终用户说他希望获得50qps,则应将其部署10次。
下面是我面临的问题。
如何使用kubernetes来在一台服务器上部署多少个Pod,并取决于它应在同一台或另一台服务器中进行部署。
例如:如果一台服务器只能处理5个Pod,并且已经有2个Pod,则它应该在同一服务器上部署3个Pod,并在另一台服务器上部署其余2个Pod。
我正在尝试使用kubernetes,但不确定如何实现。
欢迎提出任何新建议。
答案 0 :(得分:1)
使用preferredDuringSchedulingIgnoredDuringExecution
类型的节点选择器选择您的首选节点。 Reference。
要将节点中运行的Pod数量限制为五个,请使用extended resources。 将其中5个资源分配给您的首选节点。
然后修改Pod,以使其在节点上调度时消耗您定义的新资源中的1个。 Reference
您的特殊Pod将仅在具有那些资源且数量等于该节点拥有的资源数量的节点上进行调度,因此请小心地将该资源分配给应该部署Pod的其他节点。
答案 1 :(得分:0)
您必须使用NodeSelector来确保使用所需资源在正确的节点上进行部署。