林辰站在研发大楼三楼洗手间的镜子前,看着镜子里的人——眼睛里有血丝,下巴有胡茬,白衬衫的领子有点皱。
他用冷水洗了把脸,从口袋里掏出剃须刀,是那种老式的双面刀片,王哲昨天塞给他的:“辰哥,明天见李总,好歹收拾收拾。”
刀片划过皮肤,留下青色的痕迹。1998年的冬天,深圳的自来水还不算太冷。
林辰盯着镜子,脑子里过电影一样回放今天要讲的内容:开场白、问题诊断、方案架构、实施计划、预期效果、风险评估……
“林工,好了没?”门外传来王哲的声音。 “马上。”
林辰打好领带——是刘博昨天从宿舍翻出来的,深蓝色,有点旧,但熨得平整。他穿上外套,那件在郑州出差时买的灰色夹克,拍了拍袖子,走出洗手间。
走廊里已经等着四个人:王哲、刘博、周峰、张涛。
每个人都穿着自己最正式的“战袍”——王哲的白衬衫扣子扣到了最上面一颗,勒得脖子发红;
刘博的工装洗得发白,但干净;
周峰居然换了件新的格子衬衫,虽然还是格子;
张涛最正式,穿了西装,但领带打得歪歪扭扭。
“都准备好了?”林辰问。
周峰递过来一个软盘:“演示程序,在A盘。”
张涛递过一沓纸:“算法核心公式推导,手写的,李总喜欢看手稿。”
王哲递上笔记本电脑:“测试数据可视化,做了动画效果。”
刘博没递东西,只说:“测试基站,已联机。随时演示。”
林辰接过这些东西,放进那个军绿色帆布包——在北京买的,边角已经磨破了。
他看着眼前这四个兄弟,三天三夜没怎么睡,眼睛都红着,但眼神都亮着。
“走吧,”他说,“八点半,李总办公室。”
八点二十五分,五人站在李一男办公室门口。
门虚掩着,能听到里面打电话的声音,是英语,语速很快,偶尔夹杂着德语单词——李一男在跟欧洲那边讨论3G标准的事。1998年底,3G还只是纸面上的概念,但华为已经开始布局了。
等了五分钟,电话挂断。林辰敲门。 “进。”
推门进去,办公室的景象和记忆中一样:十五平米,一张办公桌,两个铁皮文件柜,墙上挂满中国地图和世界地图,红色小旗标注着华为设备的分布。不同的是,今天桌上多了几个烟灰缸——都已经满了。
李一男坐在办公桌后,正在看一份英文资料。他抬起头,金丝眼镜后的眼睛扫过五个人,最后停在林辰身上。
“坐。”他指了指对面的椅子——只有一把。 林辰坐下,其他四人站在他身后,像一支小型代表团。
李一男合上资料,是《IEEE通信汇刊》的最新一期。他拿起保温杯喝了一口茶——茶叶占了半杯,浓得发黑。然后点了支烟,红双喜,烟盒就扔在桌上。
“听说你们这几天没怎么睡觉?”李一男开口,语气听不出情绪。
“赶进度,”林辰说,“想尽快拿出阶段性成果。”
“成果呢?” 林辰从帆布包里掏出三样东西:一份装订好的方案报告、一张手绘的架构图、还有那张软盘。
“都在这儿。”
李一男接过报告,封面手写着标题:《广东GSm网络智能优化平台——方案设计与试点建议》。
他没翻开,先看那张架构图——是林辰昨晚重新画的,用三种颜色区分数据层、分析层、执行层,箭头标注数据流和指令流。
看了足足三分钟,李一男放下图,拿起报告,快速翻阅。他翻页的速度很快,但偶尔会停下来,盯着某一段文字或某个图表多看几秒。办公室里只有翻页声和墙上时钟的滴答声。
王哲在后面悄悄戳了戳林辰的后背——他紧张。林辰没动,只是看着李一男的表情。
报告翻到最后一页,李一男放下,又点了一支烟。烟雾在办公室里弥漫开来,和茶香混在一起。
“先说说你们调研的发现。”他说。
“是。”林辰站起身——坐着说话不自在。他走到墙边一块空闲的白板前,拿起笔。
“过去一周,我们跑了广东五个典型场景:广州天河、深圳华强北、东莞工业区、粤北山区、珠三角农村。”
他在白板上写下这五个地名,“发现了三类共性问题。”
“第一,孤岛式优化思维。”林辰画了五个隔开的圆圈,“覆盖优化、频率规划、参数调优、硬件维护、投诉处理——这五个环节在现有体系里基本割裂。每个环节只关注自己的KpI,导致局部优化,整体恶化。”
李一男没说话,但点了点头。
“第二,经验主义主导,数据严重贫血。”林辰写下几个例子,“天线倾角8度最合适’、‘农村基站功率调最大’——这些经验法则没有数据支撑,甚至与实测数据矛盾。优化决策靠‘我觉得’,而不是‘数据显示’。”
“第三,人肉运维,自动化缺失。”林辰调出几张照片——是调研时拍的维护人员工作场景,“所有优化工作高度依赖人工,效率低,成本高,而且人为失误率占故障的38%。”
讲完三点,林辰停顿了一下:“这三个问题相互关联,共同导致了广东移动GSm网络的‘三高’痼疾——高掉话、高拥塞、高干扰。传统方法治标不治本,所以我们需要一套全新的方法论。”
李一男弹了弹烟灰:“所以你们提出了这个……”他指了指架构图,“智能优化平台?”
“是,”林辰走回白板前,在刚才的问题旁边画了一个大框,“我们的解决方案可以概括为三句话:打通孤岛、量化经验、自动运维。”
他在大框里画出三个支柱: “第一支柱,数据感知层——打通数据孤岛。实时采集基站测量数据,对接用户投诉系统,集成话务统计平台,融合地理信息系统。让所有数据在一个池子里流动。”
“第二支柱,智能分析层——量化经验。用数据挖掘和机器学习算法,自动诊断问题,分析根因,推荐方案,预测效果。让优化决策从‘经验驱动’变成‘数据驱动’。”
“第三支柱,自动执行层——实现自动运维。开发多厂商设备适配接口,建立方案安全验证机制,实现指令自动下发和效果闭环监控。让人从重复劳动中解放出来,专注于策略制定和异常处理。”
林辰讲得很流畅,这些内容已经在脑海里过了无数遍。背后的兄弟们都松了口气——开场不错。
李一男听完,沉默了几秒,然后问了一个问题:“听起来很好,但你怎么证明这玩意儿能工作?”
“我们有原型。”林辰说。
原型演示:十台服务器与一个基站的对话
林辰示意王哲打开笔记本电脑,连上投影仪——那是一台老式的三枪投影仪,开机要预热三分钟。趁这功夫,刘博跑出去打了个电话,让楼下测试机房的同事准备。
投影亮起,屏幕上出现一个简单的图形界面——蓝色背景,白色文字,典型的1998年软件风格。
“这是我们的数据采集模块,”周峰走到前面——技术演示他来讲,“目前接入了广州天河区的十个测试基站,都是华为设备。”
他敲了几下键盘,屏幕上开始滚动数据:基站Id、时间戳、接收信号强度、干扰水平、话务量、掉话次数…… “
数据是实时的,每分钟更新一次。”
周峰调出一个曲线图,“这是三号基站过去一小时的掉话率变化,可以看到在上午九点有一个明显峰值。”
李一男身体前倾,盯着屏幕:“数据从哪里来的?”
“基站内部的性能计数器和测量报告,”周峰说,“以前这些数据只用于基站内部算法,不上报。我们改了软件配置,让它们上报到中心服务器。”
“改了哪些配置?”
“主要在基站控制器的omc-R模块上,”周峰调出代码片段,“增加了三十七个测量项的上报功能,优化了上报频率和压缩算法,保证不影响基站正常业务。”
李一男点点头,示意继续。 “接下来是分析层演示,”张涛接过话头,他有点紧张,推了三次眼镜,“我们设计了一个简化的诊断算法,基于规则引擎和统计分析。”
他在键盘上敲入一行命令,屏幕切换,显示出一个诊断报告: 基站GZ-th-003诊断结果
· 问题类型:覆盖漏洞导致掉话
· 根因分析:天线倾角过大(当前15度,建议12度)
· 影响范围:低层用户(3-8层)
· 预估改善:掉话率下降12-18%
“这个诊断怎么来的?”李一男问。
“分三步,”张涛调出算法流程图,“第一步,数据预处理,清洗异常值,归一化;第二步,特征提取,从原始数据中提取四十八个关键特征;第三步,规则匹配,用一百二十七条预设规则进行诊断。” “规则从哪里来?”
“部分来自GSm规范,部分来自我们调研中总结的经验,部分来自历史优化案例。”张涛说,“但这只是初级版本,最终我们会引入机器学习,让系统自己从数据中学习规则。”
李一男没评价,只是说:“继续。” “最后是执行层,”刘博走到电脑前——他操作键盘的方式很特别,只用两个手指,但速度极快,“我们已经实现了对测试基站的远程配置管理。”
屏幕上出现一个命令行界面,刘博输入一串指令:
SEt btS GZ-th-003 tILt_ANGLE = 12
回车。屏幕显示:
mand sent. waiting for acknowledgement...
三秒后:
btS GZ-th-003 acknowledged.
New tilt angle: 12 degrees.
“这就改完了?”李一男问。
“改完了,”刘博调出基站实时监控页面,“可以看到天线倾角参数已经更新。但实际物理调整需要维护人员去现场——我们目前只改了软件参数,天线马达的远程控制还在开发中。”
“安全机制呢?”
“三重保障,”刘博调出另一个界面,
“第一,所有指令在模拟环境预执行,验证安全;
第二,指令下发需要二级审批——现在是测试模式,只有一级;
第三,系统保留最近十次参数修改记录,支持一键回滚。”
演示结束,办公室里安静下来。投影仪的风扇嗡嗡作响,墙上的时钟指向九点二十。
李一男掐灭烟,又点了一支——这是今天上午的第四支。他靠在椅背上,看着屏幕上的界面,又看看站在面前的五个人,最后目光落在林辰身上。
“演示我看了,”他说,“技术上是可行的。但我要问几个问题。”
李一男站起身,走到白板前,拿起笔。他写了五个数字,每个数字后面画了个问号:
1. 规模问题? 十个基站能跑,一万个基站呢?
2. 厂商问题? 华为设备可以,爱立信、诺基亚呢?
3. 算法问题? 规则引擎太简单,机器学习太遥远,中间的路怎么走?
4. 风险问题? 自动执行出错怎么办?谁负责?
5. 价值问题? 投入这么大,产出值得吗?
写完,他转身看着林辰:“一个一个答。”
林辰深吸一口气。这些问题他预想过,但没想到李一男问得这么直接、这么尖锐。
“第一个问题,规模。”他走到白板前,在“1”后面画箭头,“我们的架构设计就是为大规模部署准备的。数据采集用分布式代理,每台基站一个轻量级代理程序,只负责采集和压缩,不处理。数据传回中心后,用服务器集群并行处理。我们估算过,三十台服务器集群可以处理全省一万两千个基站的数据。”
“服务器哪里来?”
“李总您已经批了二十台,”林辰说,“广东办事处协调十台,总共三十台。如果不够,我们可以用夜间闲置的计算资源——基站数据在夜里三点到五点处理压力最小,那时候服务器负载也最低。” 李一男点头,没说话。
“第二个问题,厂商。”林辰在“2”后面写方案,“分两步走。第一步,华为设备全面支持,这是我们能控制的。第二步,通过移动集团协调爱立信和诺基亚,要求他们开放北向接口。如果厂商不配合,我们开发适配层——截获网管系统的操作,转译成厂商接口能识别的指令。效率低一点,但能用。”
“移动会配合吗?”
“会,”林辰很肯定,“因为这套系统最终受益最大的是移动。我们已经和广东移动的张志强工程师达成共识,他会推动这件事。” 李一男在笔记本上记了一笔。
“第三个问题,算法。”林辰在“3”后面画了三个阶段,“短期用规则引擎,解决80%的常见问题;中期引入统计模型和专家系统,解决15%的复杂问题;长期探索机器学习,解决剩下5%的疑难杂症。我们不追求一步到位,而是迭代演进。”
“时间表?” “规则引擎一个月内上线,统计模型三个月,机器学习半年到一年。”林辰说,“但即使只有规则引擎,也能比现有的人工优化提升三倍效率。” 李一男继续记笔记。
“第四个问题,风险。”林辰在“4”后面写了几行字,“第一,所有指令必须模拟验证;第二,所有执行必须人工审核——初期是全审核,后期是抽检;第三,建立安全边界,关键参数不允许自动修改;第四,购买保险,真出事了有兜底。”
“保险?”
“我们测算过,全省推广后,每年能为移动节省运维成本三千万以上。拿出10%买保险,还有两千七百万净收益。”林辰给出具体数字,“而且前期只在小范围试点,风险可控。”
“第五个问题,价值。”林辰在“5”后面画了个表格,列出入和产出:
投入:平台开发(500万)+硬件采购(300万)+ 人力成本(200万)= 1000万
产出:运维成本节约(3000万\/年)+投诉减少(间接收益500万\/年)+ 网络质量提升(品牌价值无法估量)
投资回收期:4个月
五年净收益:1.2亿
数字清晰,逻辑严密。林辰讲完,办公室里再次安静下来。