第34章 陈明远的杀招(第1页)
1
凌晨四点,星河科技大厦。
“星语”项目区的灯光还亮着六成。行军床上横七竖八躺着补觉的人,鼾声、梦话、空调的低噪混成一片。办公桌上散落着空咖啡杯、捏扁的泡面桶、拆开的能量棒包装。
林辰站在监控大屏前,看着过去二十四小时的数据汇总。
系统可用性:99。92%(较迁移前提升0。6个百分点)
平均响应时间:113ms(下降28%)
核心错误率:0。05%(下降72%)
数据库查询性能:提升3倍
数据很漂亮。
但林辰的眉头没有松开。
过去三天,团队在完成数据库迁移后,士气达到了一个高峰。每个人都相信,最难的部分已经过去,剩下的二十三天只是按部就班地填坑。王海清甚至开始规划重构完成后,团队去哪里团建——三亚还是丽江。
但林辰知道,真正的硬仗,现在才开始。
因为“星语”系统里,埋着一个三年前留下的、所有人都知道但没人敢碰的雷。
支付核心模块。
“林总,还没睡?”
王海清揉着眼睛走过来,手里端着杯速溶咖啡。这位技术总监过去十天瘦了八斤,眼袋垂到颧骨,但眼睛里那簇火还没灭。
“看看数据。”林辰侧身,让出屏幕视野,“支付模块的延迟曲线,注意到没有?”
王海清凑近,盯着那条微微上扬的线看了几秒,脸色变了。
“每小时涨0。3毫秒……这不对劲。支付模块应该已经稳定运行三年了,怎么会……”
“不是模块本身的问题。”林辰调出调用链分析图,“你看,支付模块上游的‘风控服务’,最近七天平均响应时间从50毫秒涨到了120毫秒。而风控服务依赖的‘用户信用服务’,响应时间从30毫秒涨到了80毫秒。这两个服务的代码,最近动过吗?”
“没有。”王海清很肯定,“支付链路的核心服务,重构计划里排在三周后。按照您的吩咐,先动外围,再动核心,避免同时改太多引发雪崩。”
“那为什么响应时间在涨?”
两人沉默了几秒。
然后王海清突然想到什么,脸色一白:“除非……除非是技术债务的连锁反应。我们改了数据库,优化了网关,外围服务性能提升,导致核心链路的流量分配变了。原来被慢服务拖累的支付模块,现在吃到了更多真实流量,把底层问题暴露出来了。”
他说得很快,很急,像是在说服自己。
林辰点点头:“我也是这个判断。但这意味着,支付模块的问题,比我们预估的要严重得多。之前响应时间‘正常’,是因为被其他瓶颈掩盖了。现在瓶颈解除,它撑不住了。”
“那我们……”王海清咽了口唾沫,“要提前动支付模块?”
“必须动。”林辰说,“但怎么动,是个问题。支付模块涉及资金流,线上不能出任何差错。而且代码是三年前的老架构,写的人已经离职,文档不全,测试覆盖低。动它,风险极大。”
“可如果不动……”王海清看着那条还在缓慢爬升的延迟曲线,“照这个趋势,最多一周,支付模块的平均响应时间会突破200毫秒的SLA红线。到时候支付超时、掉单、资损……后果比系统崩溃还严重。”
两人对视一眼,都看到了对方眼里的沉重。
这才是真正的深水区。
“召集核心组,开紧急会。”林辰看了眼时间,“四点二十,会议室。给你十分钟,把风控、信用、支付三个服务的历史问题清单调出来。”
“好!”
王海清转身跑向工位。林辰留在原地,看着大屏上那些跳动的数字,在心里呼叫系统。