我是做技术的,对反腐这块完全没有专业背景,但看到这条新闻的时候确实认真研究了一下。
因为这个系统涉及的技术方向跟我日常工作有不少交集——数据治理、规则引擎、异常检测,这些东西我都碰过。
说实话,看完各种报道之后,我最大的感受不是”AI好厉害”,这个系统真正牛的地方根本不是AI,而是数据打通。
先说清楚为什么这么判断。
你去看各种报道里描述的”数据碰撞分析”到底是什么操作——系统归集了浙江省级10个部门的投资项目、市场主体等12大类信息数据,总量近亿条,然后在这些数据之间做交叉比对。
拿冯疆这个案子来说,须江阁标段26家公司投标,系统做的事情是把中标公司的资质数据、评委的打分数据、历史投标行为、工商登记信息这些东西放在一起看。
结果发现:这家公司资质平平,但技术评分比平均分高出23%。
这个异常是怎么发现的?
不是什么神秘的深度学习模型”看到了人看不到的东西”,就是把以前分散在不同部门的数据拉到一起,做了一次本来任何人都能做但一直没人做的比较。
他们分析了1000多个历史案件,总结出9种行业乱象和7类腐败问题,转化成300多条预警规则。
评委打分偏离均值超过阈值,报警;
招标参数跟某家公司产品参数高度吻合,报警;
多家投标公司存在隐性关联,报警。
这些规则不复杂,一个有经验的审计人员如果能同时看到所有数据,用电子表格都能查出来。
AI解决的不是”能不能发现”的问题,是”多快能发现”和”能不能全覆盖”的问题。
近亿条数据、300多条规则交叉跑一遍,人力需要几百人干好几年,系统跑一遍可能就是几个小时。
这很重要,但这是执行效率的改进,不是认知能力的突破。
真正的突破发生在更早的阶段——有人下决心把这些数据打通了。
为什么打通数据才是最难的部分?
因为招投标领域的腐败之所以能长期存在,根本原因不是它有多隐蔽,而是相关信息天然地分散在不同的系统里,谁也看不到全貌。
你想想一个招投标项目涉及多少环节和部门?
招标文件由建设方编制,投标公司的资质在市场监管那边,评标专家从专家库里抽,打分数据归交易中心管,工商关联信息在企业信用系统里,司法记录在法院系统里,资金往来在银行那边。
每个部门手里都有一块拼图,但从来没有人把拼图拼起来。
冯疆之所以觉得自己”隐蔽”,不是因为他做的事情真有多高明——
说白了就是牵线让评委给特定公司打高分,然后事后分钱,这操作说出来挺粗糙的——
而是因为他知道这些数据散落在十几个部门的十几套系统里,正常情况下没人会、也没能力把它们放在一起看。

评委的打分记录躺在交易中心的档案里,中标公司的股东信息在工商系统里,冯疆跟王某的关系谁也没记录。
这些信息只要不碰面,冯疆就是安全的。
我之前帮一家集团公司做内部数据中台,那段经历让我深刻理解了”打通数据”这四个字有多难。
技术上真不难,ETL管道、数据清洗、字段映射,这些都是成熟的东西。
难的是人。
财务部门觉得自己的数据是核心资产,不想共享;销售部门担心数据出去之后暴露客户关系;法务部门说有合规风险。
每个部门都有一万个不想共享数据的理由,而且很多理由听起来还挺合理。
最后项目推了一年半,靠CEO亲自逐个部门谈,才把数据勉强打通。
一家企业内部尚且如此,浙江这个系统——让10个省级政府部门把12大类数据汇到一起——这背后需要多大的协调力度?
这不是技术问题,这是治理问题。
省纪委监委和省发改委联合牵头,专门成立实验室,这个规格本身就说明了数据打通这件事有多不容易。
能做到这一步,系统就已经赢了一大半,剩下的AI分析反而是水到渠成的事。
但这件事真正让我觉得兴奋的,不是冯疆被查了,是它背后透露出来的一个逻辑:
腐败本质上是一种信息不对称的产物,而数据打通就是在系统性地消灭信息不对称。
这个逻辑如果成立,意味着反腐可以从”靠运气”走向”靠系统”。
你看冯疆这个案子,以前要怎么查?要么有人举报,要么纪委专项巡视恰好查到。
这两种方式有一个共同的致命缺陷:都是被动的、随机的、覆盖率极低的。
举报靠的是有人愿意站出来——招投标领域的利益相关方往往都是受益者,谁会去举报?
专项巡视靠的是抽查运气,一年能查多少项目?
冯疆2020年在雨污管网改造项目里搞量身定制——把招标文件里的核心设备参数设定为特定老板的产品参数,直接把其他竞争者排除在外——收了二十多万。
这个事情过了四五年,直到系统回溯扫描历史项目才被翻出来。
如果没有这个系统,大概率永远不会被查到。
没有人举报,也没有巡视组查到那个项目。
但数据一直在那里,异常一直在那里,只是以前没有人把它们放到一起看而已。
系统上线之后,这类发现变成了自动的、全覆盖的,不依赖举报人的勇气,不依赖巡视组的运气。
22个项目跑一遍,3个有问题的直接标红推送给纪委核查,这才是这个系统真正可怕的地方——
不是它查到了冯疆,是它建立了一种机制,让冯疆这样的人被发现从小概率事件变成了大概率事件。
做了这么多年工程,我有一个很朴素的认知:能用系统解决的问题就别靠人。
人会累,人有私心,人有盲区,系统不会。
你可以腐蚀某个审计人员让他睁一只眼闭一只眼,但你没办法让系统不产生预警。
当然你可以腐蚀接到预警之后负责核查的人,但那是另一个层面的问题了,至少预警本身是客观的、不可被收买的。

但我也得说点不那么乐观的,不然这回答就成新闻通稿了。
做过风控系统的人都知道一个道理:规则上线的那一刻,就是攻防博弈开始的那一刻。
系统总结了1000多个历史案件的模式来建规则,但那些真正老练的人不会坐以待毙。
评委打分偏差控制得再小一点、关联公司的工商关系做得更隐蔽一点——不用直接的亲属关系而是通过三四层代持——不在一个大项目里集中操作而是分散到多个小项目里摊薄风险。
这些都是完全可能的规避手段。
系统得持续更新规则、持续学习新的腐败模式,不然早晚会变成马其诺防线。
不过话说回来,攻防博弈的存在本身不全是坏事——因为它系统性地提高了腐败的成本和风险。
以前伸手几乎是零成本的赌博,”只要没人举报就没事”;
现在你得先研究系统的规则、精心设计规避方案、确保每一个数据维度都不会触发异常,这本身就大幅抬高了门槛。
更让我在意的是准确性的问题。
报道里说准确率”相当高”,但没给具体数字,这让我有点不安。
22个项目实战查出3个有问题的,那另外19个呢?
是完全没有触发预警,还是触发了预警但核查后排除了?
做数据分析的人都知道,数据集够大的时候统计异常不代表一定有问题。
有些评分偏差可能就是评委确实认为某家公司技术方案更好,有些企业关联可能就是正常的商业合作。
从”异常”到”腐败”之间,隔着一整条需要人来走的判断链,这条链不能被算法短路。
如果系统预警在实际运作中变成了某种程度的”有罪推定”——被标红的企业在后续招标中被区别对待、相关人员因为核查本身而承受压力——那好经就被念歪了。
浙江目前的设计是”系统预警+人工核查”的闭环,这个架构是对的,但执行中会不会走形需要持续观察。
而且说实话,浙江能做成这个系统,跟浙江本身数字化水平高、行政协调能力强有很大关系。
换一个数据基础薄弱、部门壁垒森严的地方,同样的技术方案可能就推不动。
技术可以输出,数据治理能力和政治意志输出不了。
最后说点我自己的感受吧。
我不是搞反腐的,这方面完全是外行。
但从一个做数据系统的人的角度看,这件事最让我感触的一点是:技术从来不是障碍,障碍是愿不愿意让数据透明。
浙江这套系统用到的技术——数据清洗、规则引擎、异常检测、多源数据交叉比对——在金融风控和电商反欺诈领域早就玩了十几年了,一点都不新鲜。
为什么招投标领域现在才用上?因为以前没人愿意——或者说没人有能力推动把这些数据放到一起。
数据分散的状态,本身就是某些人的保护伞。打通数据这个动作,比上线任何AI模型都更具颠覆性。
所以我觉得这个新闻真正的价值不在于”AI抓贪官”这个吸睛的标题,说实话这个标题把功劳归给AI有点过了——
而在于它证明了一种基于数据透明的、系统化的监督机制在公权力领域是可行的。
冯疆被查只是一个案例,重要的是这个系统会持续运行、持续扫描。
当一个人想伸手的时候,他不再是在赌”有没有人注意到我”,而是在赌”我能不能骗过一个分析了上千个案件、掌握近亿条数据、永远不会疲倦也不会收红包的系统”。
这个赌注的胜率,会越来越低。
这不是AI的胜利,是数据透明的胜利。
AI只是那个最后帮你翻数据的工具,真正改变游戏规则的,是有人下决心把数据打通了。
希望这个决心不只停留在浙江。