阿里云DMS流程

引言

我们的经典问题又来了，关于这个问题大家的想法不尽相同。但有一点是我们的共识，那就是都无法完全清晰地阐述整个流程。那么今天，我们就来着力解决这个问题。

通过监控平台（如Prometheus + Grafana）捕获数据库相关异常指标，如：数据库QPS突增、CPU使用率超阈值（>80%）、慢查询数量激增（如MySQL Slow_queries每分钟超过100次）。

-- 实时监控慢查询数量
SHOW GLOBAL STATUS LIKE 'Slow_queries';

立即限制高危操作的并发量，防止雪崩效应：

-- 动态限制最大连接数（临时降低至200）
SET GLOBAL max_connections = 200;

-- 使用pt-kill终止耗时超过10秒的查询
pt-kill --busy-time 10 --kill --victims all --print h=127.0.0.1