我正在尝试使用Deployment
扩展Kubernetes HorizontalPodAutoscaler
,它会通过Stackdriver监听自定义指标。
我有一个启用了Stackdriver适配器的GKE集群。 我可以将自定义指标类型发布到Stackdriver,以下是它在Stackdriver Metric Explorer中显示的方式。
这就是我定义HPA
的方式:
apiVersion: autoscaling/v2beta1
kind: HorizontalPodAutoscaler
metadata:
name: example-hpa
spec:
minReplicas: 1
maxReplicas: 10
metrics:
- type: External
external:
metricName: custom.googleapis.com|worker_pod_metrics|baz
targetValue: 400
scaleTargetRef:
apiVersion: apps/v1
kind: Deployment
name: test-app-group-1-1
成功创建example-hpa
后,执行kubectl get hpa example-hpa
,始终将TARGETS
显示为<unknown>
,并且永远不会从自定义指标中检测到该值。
NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE
example-hpa Deployment/test-app-group-1-1 <unknown>/400 1 10 1 18m
我正在使用在 local 上运行的Java客户端来发布我的自定义指标。 我已经给了here所提到的适当的资源标签(硬编码-这样它就可以在本地环境中正常运行)。我遵循了this document来创建Java客户端。
private static MonitoredResource prepareMonitoredResourceDescriptor() {
Map<String, String> resourceLabels = new HashMap<>();
resourceLabels.put("project_id", "<<<my-project-id>>>);
resourceLabels.put("pod_id", "<my pod UID>");
resourceLabels.put("container_name", "");
resourceLabels.put("zone", "asia-southeast1-b");
resourceLabels.put("cluster_name", "my-cluster");
resourceLabels.put("namespace_id", "mynamespace");
resourceLabels.put("instance_id", "");
return MonitoredResource.newBuilder()
.setType("gke_container")
.putAllLabels(resourceLabels)
.build();
}
在上述步骤中我在做什么错?预先感谢您提供的任何答案!
编辑[已解决] :
我想我有一些配置错误,因为kubectl describe hpa [NAME] --v=9
向我显示了一些403
状态代码,以及我使用的是type: External
而不是type: Pods
(感谢MWZ为您的答案,指出此错误)。
我设法通过创建一个新项目,一个新服务帐户和一个新GKE群集(基本上是从头开始的所有内容)来修复它。然后,按照this document的说明,如下所述更改了yaml文件。
apiVersion: autoscaling/v2beta1
kind: HorizontalPodAutoscaler
metadata:
name: test-app-group-1-1
namespace: default
spec:
scaleTargetRef:
apiVersion: apps/v1beta1
kind: Deployment
name: test-app-group-1-1
minReplicas: 1
maxReplicas: 5
metrics:
- type: Pods # Earlier this was type: External
pods: # Earlier this was external:
metricName: baz # metricName: custom.googleapis.com|worker_pod_metrics|baz
targetAverageValue: 20
我现在要导出为custom.googleapis.com/baz
,而不是custom.googleapis.com/worker_pod_metrics/baz
。另外,现在我在Yaml中为我的HPA明确指定了namespace
。
答案 0 :(得分:2)
由于您可以在Stackdriver GUI中看到自定义指标,因此我猜测指标已正确导出。基于Autoscaling Deployments with Custom Metrics,我认为您错误地定义了HPA用来扩展部署的指标。
请尝试使用此YAML:
apiVersion: autoscaling/v2beta1
kind: HorizontalPodAutoscaler
metadata:
name: example-hpa
spec:
minReplicas: 1
maxReplicas: 10
metrics:
- type: Pods
pods:
metricName: baz
targetAverageValue: 400
scaleTargetRef:
apiVersion: apps/v1
kind: Deployment
name: test-app-group-1-1
请记住:
HPA使用指标来计算平均值并将其与 目标平均值。在应用程序到Stackdriver的导出中 例如,部署包含导出指标的Pod。下列 清单文件描述了一个HorizontalPodAutoscaler对象,该对象可缩放 根据指标的目标平均值进行部署。
page above中所述的故障排除步骤也可能有用。
旁注
由于上述HPA使用的是Beta API autoscaling/v2beta1
,因此在运行kubectl describe hpa [DEPLOYMENT_NAME]
时出现错误。我运行了kubectl describe hpa [DEPLOYMENT_NAME] --v=9
,并在JSON中得到了响应。
答案 1 :(得分:1)
最好放置一些唯一的标签来定位指标。目前,根据Java客户端中标记的指标,只有pod_id
看起来是唯一的,由于其无状态的性质而无法使用。
因此,我建议您尝试引入一个部署/指标范围内的无用标识符。
resourceLabels.put("<identifier>", "<could-be-deployment-name>");
之后,您可以尝试使用类似于以下内容的方法来修改HPA:
kind: HorizontalPodAutoscaler
metadata:
name: example-hpa
spec:
minReplicas: 1
maxReplicas: 10
metrics:
- type: External
external:
metricName: custom.googleapis.com|worker_pod_metrics|baz
metricSelector:
matchLabels:
# define labels to target
metric.labels.identifier: <deployment-name>
# scale +1 whenever it crosses multiples of mentioned value
targetAverageValue: "400"
scaleTargetRef:
apiVersion: apps/v1
kind: Deployment
name: test-app-group-1-1
除此之外,此设置没有问题,应该可以顺利进行。
Helper命令以查看哪些指标适用于HPA:
kubectl get --raw "/apis/external.metrics.k8s.io/v1beta1/namespaces/default/custom.googleapis.com|worker_pod_metrics|baz" | jq