应用错误收集

我的一些AppEngine项目出了问题，因为我开始在我的vm.syslog日志中看到很多错误（我注意到健康检查到来时可能会发生这些错误）

具体如下：

write_gcm：服务器响应（CollectdTimeseriesRequest）包含错误：＃012 {＃012＆＃34; payloadErrors＆＃34;：[＃012 {＃012＆＃34; index＆＃34;：71，＃012＆＃34;错误＆＃34;：{＃012＆＃34;代码＆＃34;：3，＃012＆＃34;消息＆＃34;：＆＃34;预期的4个标签。找到0.有效载荷的标签不匹配[values {\ n data_source_name：\＆＃34; value \＆＃34; \ n data_source_type：GAUGE \ n value {\ n double_value：694411264 \ n} \ n} \ nstart_time {\ n秒：1513266364 \ n nanos：618061284 \ n} \ nend_time {\ n秒：1513266364 \ n nanos：618061284 \ n} \ nplugin：\＆＃34; processes \＆＃34; \ nplugin_instance：\＆＃34; all \＆＃34; \ ntype：\＆＃34; ps_rss \＆＃34; \ n]在资源上[类型：\＆＃34; gce_instance \＆＃34; \ nlabels {\ n key：\＆＃34; instance_id \＆＃34; \ n值：\＆＃34; xxx \＆＃34; \ n} \ nlabels {\ n key：\＆＃34; zone \＆＃34; \ n值：\＆＃34 ; Europe-west2-a \＆＃34; \ n} \ n]项目xxx＆＃34;＃012}＃012}＃012]＃012}
write_gcm：不成功的HTTP请求400：{＃012＆＃34;错误＆＃34;：{＃012＆＃34;代码＆＃34;：400，＃012＆＃34;消息＆＃34;：＆＃34 ;字段timeSeries [11] .metric.labels [1]的值为\＆＃34; health_check_type \＆＃34;：无法识别的度量标签。＆＃34;，＃012＆＃34; status＆＃34;：＆＃34; INVALID_ARGUMENT＆＃34;＃012}＃012}
write_gcm：与端点通话时出错。
write_gcm：wg_transmit_unique_segment失败。
write_gcm：wg_transmit_unique_segments失败。潮红。

与此同时，我注意到我在AppEngine仪表板中对于相同项目的内存使用量随着时间的推移而增加，达到可用的最大数量并且实例重新启动，当时发生502错误访问该应用正在投放的网站。

所有这些都没有发生在至少2周以来尚未更新的几个项目中（上述错误或内存都没有增加）但是当使用相同的代码库部署时，它确实发生在新创建的实例上健康的项目。此外，在本地运行项目时，我似乎没有看到任何内存增加。

有人可以轻轻地告诉我他们是否经历过类似的事情，或者他们是否认为错误和记忆增加是相关的？我最近没有更改我的yaml文件以进行部署，但我还没有为运行状况检查指定任何自定义配置（以默认速率在传统模式下运行）。

感谢您的帮助，尼古拉

在NodeJS AppEngine上，vm.syslog和内存使用中的错误不断增加

2 个答案: