我们还希望开发人员和运营人员同样了解一些关键指标并且开发人员正在花时间观察针对运营的指标和警报在极少数情况下可能是由于更广泛的 Internet 上的路由问题,我们可能会发现我们以所需速度推动更改的能力变得不切实际。为确保我们尽快了解此事并知道何时采取行动,我们建立了一个自定义警报系统,办公室中的每个人都可以看到。 我们从外部全球机器集合中监控 DNS 记录的传播时间,并在传播时间超过预设阈值时触发警报。警报以蓝色旋转的“警灯”形式出现。 我们开玩笑说当我们落后于传播时会有一个“红色警报”警报,所以我把这个笑话变成了现实。