测试

我是做技术的，对反腐这块完全没有专业背景，但看到这条新闻的时候确实认真研究了一下。

因为这个系统涉及的技术方向跟我日常工作有不少交集——数据治理、规则引擎、异常检测，这些东西我都碰过。

说实话，看完各种报道之后，我最大的感受不是”AI好厉害”，这个系统真正牛的地方根本不是AI，而是数据打通。

先说清楚为什么这么判断。

你去看各种报道里描述的”数据碰撞分析”到底是什么操作——系统归集了浙江省级10个部门的投资项目、市场主体等12大类信息数据，总量近亿条，然后在这些数据之间做交叉比对。

拿冯疆这个案子来说，须江阁标段26家公司投标，系统做的事情是把中标公司的资质数据、评委的打分数据、历史投标行为、工商登记信息这些东西放在一起看。

结果发现：这家公司资质平平，但技术评分比平均分高出23%。

这个异常是怎么发现的？

不是什么神秘的深度学习模型”看到了人看不到的东西”，就是把以前分散在不同部门的数据拉到一起，做了一次本来任何人都能做但一直没人做的比较。

他们分析了1000多个历史案件，总结出9种行业乱象和7类腐败问题，转化成300多条预警规则。

评委打分偏离均值超过阈值，报警；

招标参数跟某家公司产品参数高度吻合，报警；

多家投标公司存在隐性关联，报警。

这些规则不复杂，一个有经验的审计人员如果能同时看到所有数据，用电子表格都能查出来。

AI解决的不是”能不能发现”的问题，是”多快能发现”和”能不能全覆盖”的问题。

近亿条数据、300多条规则交叉跑一遍，人力需要几百人干好几年，系统跑一遍可能就是几个小时。

这很重要，但这是执行效率的改进，不是认知能力的突破。

真正的突破发生在更早的阶段——有人下决心把这些数据打通了。

为什么打通数据才是最难的部分？

因为招投标领域的腐败之所以能长期存在，根本原因不是它有多隐蔽，而是相关信息天然地分散在不同的系统里，谁也看不到全貌。

你想想一个招投标项目涉及多少环节和部门？

招标文件由建设方编制，投标公司的资质在市场监管那边，评标专家从专家库里抽，打分数据归交易中心管，工商关联信息在企业信用系统里，司法记录在法院系统里，资金往来在银行那边。

每个部门手里都有一块拼图，但从来没有人把拼图拼起来。

冯疆之所以觉得自己”隐蔽”，不是因为他做的事情真有多高明——

说白了就是牵线让评委给特定公司打高分，然后事后分钱，这操作说出来挺粗糙的——

而是因为他知道这些数据散落在十几个部门的十几套系统里，正常情况下没人会、也没能力把它们放在一起看。

评委的打分记录躺在交易中心的档案里，中标公司的股东信息在工商系统里，冯疆跟王某的关系谁也没记录。

这些信息只要不碰面，冯疆就是安全的。

我之前帮一家集团公司做内部数据中台，那段经历让我深刻理解了”打通数据”这四个字有多难。

技术上真不难，ETL管道、数据清洗、字段映射，这些都是成熟的东西。

难的是人。

财务部门觉得自己的数据是核心资产，不想共享；销售部门担心数据出去之后暴露客户关系；法务部门说有合规风险。

每个部门都有一万个不想共享数据的理由，而且很多理由听起来还挺合理。

最后项目推了一年半，靠CEO亲自逐个部门谈，才把数据勉强打通。

一家企业内部尚且如此，浙江这个系统——让10个省级政府部门把12大类数据汇到一起——这背后需要多大的协调力度？

这不是技术问题，这是治理问题。

省纪委监委和省发改委联合牵头，专门成立实验室，这个规格本身就说明了数据打通这件事有多不容易。

能做到这一步，系统就已经赢了一大半，剩下的AI分析反而是水到渠成的事。

但这件事真正让我觉得兴奋的，不是冯疆被查了，是它背后透露出来的一个逻辑：

腐败本质上是一种信息不对称的产物，而数据打通就是在系统性地消灭信息不对称。

这个逻辑如果成立，意味着反腐可以从”靠运气”走向”靠系统”。

你看冯疆这个案子，以前要怎么查？要么有人举报，要么纪委专项巡视恰好查到。

这两种方式有一个共同的致命缺陷：都是被动的、随机的、覆盖率极低的。

举报靠的是有人愿意站出来——招投标领域的利益相关方往往都是受益者，谁会去举报？

专项巡视靠的是抽查运气，一年能查多少项目？

冯疆2020年在雨污管网改造项目里搞量身定制——把招标文件里的核心设备参数设定为特定老板的产品参数，直接把其他竞争者排除在外——收了二十多万。

这个事情过了四五年，直到系统回溯扫描历史项目才被翻出来。

如果没有这个系统，大概率永远不会被查到。

没有人举报，也没有巡视组查到那个项目。

但数据一直在那里，异常一直在那里，只是以前没有人把它们放到一起看而已。

系统上线之后，这类发现变成了自动的、全覆盖的，不依赖举报人的勇气，不依赖巡视组的运气。

22个项目跑一遍，3个有问题的直接标红推送给纪委核查，这才是这个系统真正可怕的地方——

不是它查到了冯疆，是它建立了一种机制，让冯疆这样的人被发现从小概率事件变成了大概率事件。

做了这么多年工程，我有一个很朴素的认知：能用系统解决的问题就别靠人。

人会累，人有私心，人有盲区，系统不会。

你可以腐蚀某个审计人员让他睁一只眼闭一只眼，但你没办法让系统不产生预警。

当然你可以腐蚀接到预警之后负责核查的人，但那是另一个层面的问题了，至少预警本身是客观的、不可被收买的。

但我也得说点不那么乐观的，不然这回答就成新闻通稿了。

做过风控系统的人都知道一个道理：规则上线的那一刻，就是攻防博弈开始的那一刻。

系统总结了1000多个历史案件的模式来建规则，但那些真正老练的人不会坐以待毙。

评委打分偏差控制得再小一点、关联公司的工商关系做得更隐蔽一点——不用直接的亲属关系而是通过三四层代持——不在一个大项目里集中操作而是分散到多个小项目里摊薄风险。

这些都是完全可能的规避手段。

系统得持续更新规则、持续学习新的腐败模式，不然早晚会变成马其诺防线。

不过话说回来，攻防博弈的存在本身不全是坏事——因为它系统性地提高了腐败的成本和风险。

以前伸手几乎是零成本的赌博，”只要没人举报就没事”；

现在你得先研究系统的规则、精心设计规避方案、确保每一个数据维度都不会触发异常，这本身就大幅抬高了门槛。

更让我在意的是准确性的问题。

报道里说准确率”相当高”，但没给具体数字，这让我有点不安。

22个项目实战查出3个有问题的，那另外19个呢？

是完全没有触发预警，还是触发了预警但核查后排除了？

做数据分析的人都知道，数据集够大的时候统计异常不代表一定有问题。

有些评分偏差可能就是评委确实认为某家公司技术方案更好，有些企业关联可能就是正常的商业合作。

从”异常”到”腐败”之间，隔着一整条需要人来走的判断链，这条链不能被算法短路。

如果系统预警在实际运作中变成了某种程度的”有罪推定”——被标红的企业在后续招标中被区别对待、相关人员因为核查本身而承受压力——那好经就被念歪了。

浙江目前的设计是”系统预警+人工核查”的闭环，这个架构是对的，但执行中会不会走形需要持续观察。

而且说实话，浙江能做成这个系统，跟浙江本身数字化水平高、行政协调能力强有很大关系。

换一个数据基础薄弱、部门壁垒森严的地方，同样的技术方案可能就推不动。

技术可以输出，数据治理能力和政治意志输出不了。

最后说点我自己的感受吧。

我不是搞反腐的，这方面完全是外行。

但从一个做数据系统的人的角度看，这件事最让我感触的一点是：技术从来不是障碍，障碍是愿不愿意让数据透明。

浙江这套系统用到的技术——数据清洗、规则引擎、异常检测、多源数据交叉比对——在金融风控和电商反欺诈领域早就玩了十几年了，一点都不新鲜。

为什么招投标领域现在才用上？因为以前没人愿意——或者说没人有能力推动把这些数据放到一起。

数据分散的状态，本身就是某些人的保护伞。打通数据这个动作，比上线任何AI模型都更具颠覆性。

所以我觉得这个新闻真正的价值不在于”AI抓贪官”这个吸睛的标题，说实话这个标题把功劳归给AI有点过了——

而在于它证明了一种基于数据透明的、系统化的监督机制在公权力领域是可行的。

冯疆被查只是一个案例，重要的是这个系统会持续运行、持续扫描。

当一个人想伸手的时候，他不再是在赌”有没有人注意到我”，而是在赌”我能不能骗过一个分析了上千个案件、掌握近亿条数据、永远不会疲倦也不会收红包的系统”。

这个赌注的胜率，会越来越低。

这不是AI的胜利，是数据透明的胜利。

AI只是那个最后帮你翻数据的工具，真正改变游戏规则的，是有人下决心把数据打通了。

希望这个决心不只停留在浙江。

Leave a Reply Cancel reply