我已经使用KOPS在Google Cloud Platform中配置了集群。我使用“ TCP LoadBalancer”选项将服务公开。在当前方案中,如果集群中运行的Pod达到了最大请求,则该请求将重定向到同一集群中的另一个Pod。我的问题是可以管理或限制Pod处理的请求,以便我可以定义Pod接收请求的阈值。
答案 0 :(得分:0)
不可能这样做。 GCP不在负载平衡器上提供此类指标。您可能会在Documentation中找到与所需内容类似的信息。
后端服务
Backend services将传入流量定向到一个或多个连接的后端。每个后端由instance group和其他服务容量元数据组成。后端服务容量可以基于CPU或requests per second (RPS)。