我是做技术的,对反腐这块完全没有专业背景,但看到这条新闻的时候确实认真研究了一下。

因为这个系统涉及的技术方向跟我日常工作有不少交集——数据治理、规则引擎、异常检测,这些东西我都碰过。

说实话,看完各种报道之后,我最大的感受不是”AI好厉害”,这个系统真正牛的地方根本不是AI,而是数据打通。

先说清楚为什么这么判断。

你去看各种报道里描述的”数据碰撞分析”到底是什么操作——系统归集了浙江省级10个部门的投资项目、市场主体等12大类信息数据,总量近亿条,然后在这些数据之间做交叉比对。

拿冯疆这个案子来说,须江阁标段26家公司投标,系统做的事情是把中标公司的资质数据、评委的打分数据、历史投标行为、工商登记信息这些东西放在一起看。

结果发现:这家公司资质平平,但技术评分比平均分高出23%。

这个异常是怎么发现的?

不是什么神秘的深度学习模型”看到了人看不到的东西”,就是把以前分散在不同部门的数据拉到一起,做了一次本来任何人都能做但一直没人做的比较。

他们分析了1000多个历史案件,总结出9种行业乱象和7类腐败问题,转化成300多条预警规则。

评委打分偏离均值超过阈值,报警;

招标参数跟某家公司产品参数高度吻合,报警;

多家投标公司存在隐性关联,报警。

这些规则不复杂,一个有经验的审计人员如果能同时看到所有数据,用电子表格都能查出来。

AI解决的不是”能不能发现”的问题,是”多快能发现”和”能不能全覆盖”的问题。

 近亿条数据、300多条规则交叉跑一遍,人力需要几百人干好几年,系统跑一遍可能就是几个小时。

这很重要,但这是执行效率的改进,不是认知能力的突破。

真正的突破发生在更早的阶段——有人下决心把这些数据打通了。

为什么打通数据才是最难的部分?

因为招投标领域的腐败之所以能长期存在,根本原因不是它有多隐蔽,而是相关信息天然地分散在不同的系统里,谁也看不到全貌。

你想想一个招投标项目涉及多少环节和部门?

招标文件由建设方编制,投标公司的资质在市场监管那边,评标专家从专家库里抽,打分数据归交易中心管,工商关联信息在企业信用系统里,司法记录在法院系统里,资金往来在银行那边。

每个部门手里都有一块拼图,但从来没有人把拼图拼起来。

冯疆之所以觉得自己”隐蔽”,不是因为他做的事情真有多高明——

说白了就是牵线让评委给特定公司打高分,然后事后分钱,这操作说出来挺粗糙的——

而是因为他知道这些数据散落在十几个部门的十几套系统里,正常情况下没人会、也没能力把它们放在一起看。

图片

评委的打分记录躺在交易中心的档案里,中标公司的股东信息在工商系统里,冯疆跟王某的关系谁也没记录。

这些信息只要不碰面,冯疆就是安全的。

我之前帮一家集团公司做内部数据中台,那段经历让我深刻理解了”打通数据”这四个字有多难。

技术上真不难,ETL管道、数据清洗、字段映射,这些都是成熟的东西。

难的是人。

财务部门觉得自己的数据是核心资产,不想共享;销售部门担心数据出去之后暴露客户关系;法务部门说有合规风险。

每个部门都有一万个不想共享数据的理由,而且很多理由听起来还挺合理。

最后项目推了一年半,靠CEO亲自逐个部门谈,才把数据勉强打通。

一家企业内部尚且如此,浙江这个系统——让10个省级政府部门把12大类数据汇到一起——这背后需要多大的协调力度?

这不是技术问题,这是治理问题。

省纪委监委和省发改委联合牵头,专门成立实验室,这个规格本身就说明了数据打通这件事有多不容易。

能做到这一步,系统就已经赢了一大半,剩下的AI分析反而是水到渠成的事。

但这件事真正让我觉得兴奋的,不是冯疆被查了,是它背后透露出来的一个逻辑:

腐败本质上是一种信息不对称的产物,而数据打通就是在系统性地消灭信息不对称。 

这个逻辑如果成立,意味着反腐可以从”靠运气”走向”靠系统”。

你看冯疆这个案子,以前要怎么查?要么有人举报,要么纪委专项巡视恰好查到。

这两种方式有一个共同的致命缺陷:都是被动的、随机的、覆盖率极低的。

举报靠的是有人愿意站出来——招投标领域的利益相关方往往都是受益者,谁会去举报?

专项巡视靠的是抽查运气,一年能查多少项目?

冯疆2020年在雨污管网改造项目里搞量身定制——把招标文件里的核心设备参数设定为特定老板的产品参数,直接把其他竞争者排除在外——收了二十多万。

这个事情过了四五年,直到系统回溯扫描历史项目才被翻出来。

如果没有这个系统,大概率永远不会被查到。

没有人举报,也没有巡视组查到那个项目。

但数据一直在那里,异常一直在那里,只是以前没有人把它们放到一起看而已。

系统上线之后,这类发现变成了自动的、全覆盖的,不依赖举报人的勇气,不依赖巡视组的运气。

22个项目跑一遍,3个有问题的直接标红推送给纪委核查,这才是这个系统真正可怕的地方——

不是它查到了冯疆,是它建立了一种机制,让冯疆这样的人被发现从小概率事件变成了大概率事件。 

做了这么多年工程,我有一个很朴素的认知:能用系统解决的问题就别靠人。

人会累,人有私心,人有盲区,系统不会。

你可以腐蚀某个审计人员让他睁一只眼闭一只眼,但你没办法让系统不产生预警。

当然你可以腐蚀接到预警之后负责核查的人,但那是另一个层面的问题了,至少预警本身是客观的、不可被收买的。

图片

但我也得说点不那么乐观的,不然这回答就成新闻通稿了。

做过风控系统的人都知道一个道理:规则上线的那一刻,就是攻防博弈开始的那一刻。

系统总结了1000多个历史案件的模式来建规则,但那些真正老练的人不会坐以待毙。

评委打分偏差控制得再小一点、关联公司的工商关系做得更隐蔽一点——不用直接的亲属关系而是通过三四层代持——不在一个大项目里集中操作而是分散到多个小项目里摊薄风险。

这些都是完全可能的规避手段。

系统得持续更新规则、持续学习新的腐败模式,不然早晚会变成马其诺防线

不过话说回来,攻防博弈的存在本身不全是坏事——因为它系统性地提高了腐败的成本和风险。

以前伸手几乎是零成本的赌博,”只要没人举报就没事”;

现在你得先研究系统的规则、精心设计规避方案、确保每一个数据维度都不会触发异常,这本身就大幅抬高了门槛。

更让我在意的是准确性的问题。

报道里说准确率”相当高”,但没给具体数字,这让我有点不安。

22个项目实战查出3个有问题的,那另外19个呢?

是完全没有触发预警,还是触发了预警但核查后排除了?

做数据分析的人都知道,数据集够大的时候统计异常不代表一定有问题。

有些评分偏差可能就是评委确实认为某家公司技术方案更好,有些企业关联可能就是正常的商业合作。

从”异常”到”腐败”之间,隔着一整条需要人来走的判断链,这条链不能被算法短路。 

如果系统预警在实际运作中变成了某种程度的”有罪推定”——被标红的企业在后续招标中被区别对待、相关人员因为核查本身而承受压力——那好经就被念歪了。

浙江目前的设计是”系统预警+人工核查”的闭环,这个架构是对的,但执行中会不会走形需要持续观察。

而且说实话,浙江能做成这个系统,跟浙江本身数字化水平高、行政协调能力强有很大关系。

换一个数据基础薄弱、部门壁垒森严的地方,同样的技术方案可能就推不动。

技术可以输出,数据治理能力和政治意志输出不了。

最后说点我自己的感受吧。

我不是搞反腐的,这方面完全是外行。

但从一个做数据系统的人的角度看,这件事最让我感触的一点是:技术从来不是障碍,障碍是愿不愿意让数据透明。

 浙江这套系统用到的技术——数据清洗、规则引擎、异常检测、多源数据交叉比对——在金融风控和电商反欺诈领域早就玩了十几年了,一点都不新鲜。

为什么招投标领域现在才用上?因为以前没人愿意——或者说没人有能力推动把这些数据放到一起。

数据分散的状态,本身就是某些人的保护伞。打通数据这个动作,比上线任何AI模型都更具颠覆性。

所以我觉得这个新闻真正的价值不在于”AI抓贪官”这个吸睛的标题,说实话这个标题把功劳归给AI有点过了——

而在于它证明了一种基于数据透明的、系统化的监督机制在公权力领域是可行的。 

冯疆被查只是一个案例,重要的是这个系统会持续运行、持续扫描。

当一个人想伸手的时候,他不再是在赌”有没有人注意到我”,而是在赌”我能不能骗过一个分析了上千个案件、掌握近亿条数据、永远不会疲倦也不会收红包的系统”。

这个赌注的胜率,会越来越低。

这不是AI的胜利,是数据透明的胜利。

AI只是那个最后帮你翻数据的工具,真正改变游戏规则的,是有人下决心把数据打通了。

希望这个决心不只停留在浙江。


Leave a Reply

Your email address will not be published. Required fields are marked *