今天聊一个不太好听的话题。我最近接触了很多正在做AI转型的制造企业,发现一个共性现象:每家企业的PPT上写的都是"数据驱动决策",但你到车间一看,数据根本就没有真正在流动。
这件事比模型选型、算力配置、算法调优都重要,却被绝大多数企业忽略了。
"硬件满配,数据裸奔"是制造业的常态
我见过不少工厂,设备是最新的,机器人上了好几台,MES、ERP、WMS一个不缺。但你问他们一个问题:你这台CNC加工中心过去三个月的主轴振动数据在哪里?答案往往是——在设备厂家的后台,或者根本没采集。你再问:上周那条产线的良品率波动,能调出来看看吗?答案是质检员本子上有,但系统里没有。
这种状态我给它起了个名字,叫"数据裸奔"。设备在跑,系统在跑,但数据像散落在沙滩上的贝壳,没有人把它们串起来。
有意思的是,绝大多数厂长并不觉得这是个问题。他们的逻辑是:我有MES,我有ERP,系统里有数据啊。但"系统里有"和"数据可用"是两回事。你的MES里记录了工单状态,但这条产线每一个工位的实时节拍差异,它记了吗?你的ERP里记录了物料库存,但供应商的实际到货延迟率,它分析了吗?
数据存在系统里不叫数据资产,数据能被调用来解决问题,才叫资产。大部分工厂的数据,充其量只能叫"电子化的记录"。
数据基建不是选系统,是回答三个问题
国家三月份发的工业数据筑基行动文件,核心指向其实就是这件事。但很多企业看到"数据治理"四个字就条件反射地想去买一套数据中台。我的建议恰恰相反:先别碰任何新系统,拿出一张白纸,回答三个问题。
第一,你的数据在哪里?这句话听起来简单,做起来可能要三个月。我说的"在哪里"不是指"在哪个系统里",而是:谁能调取、调取要多长时间、格式是什么、能不能和其他数据做关联。你在白纸上画出来,很可能会吓一跳——你自以为连通的系统,其实到处都是断层。
第二,你的数据准不准?我见过一个极端案例,同一批次产品的良品率,质检系统记录的是97%,生产系统记录的是94%,财务系统的成本核算用的是96%。三个数字,三个系统,各说各话。数据不准,比没有数据更可怕,因为你会基于错误的信息做决策,而且你还不知道自己做错了。
第三,你的数据能回答什么问题?这一步最容易被跳过。企业往往急于让数据"产生价值",但如果你连"数据能帮我们解决什么问题"都没想清楚,那所有后续动作都是在盲目堆砌。
这三个问题分别对应数据治理的三个环节:可发现、可信赖、可应用。顺序不能反。
先让一块数据跑通,比铺开十套系统管用
我见过太多企业在数据治理上犯的错就是贪多。一上来就想把所有业务线的数据全打通,结果半年过去了,钱花了不少,数据还是一塌糊涂。
我的判断是:先让一块数据跑通。选一个对业务影响最大、数据相对成熟的方向,比如设备运维。先把这台关键设备的运行数据、维修记录、备件库存打通,让它能回答"下一次故障可能什么时候发生"这个问题。就这一个闭环跑通了,内部就有了信心和方法论,再往其他方向扩展就容易多了。
我一直在说,制造业AI落地有一个被严重低估的前提:企业不缺系统,缺的是让数据从"电子记录"变成"决策弹药"的方法。系统是仓库,数据是原材料,AI是生产线。你的仓库再大,原材料堆在里面不去加工,它永远变不成产品。
核心观点
制造业AI落地的隐形前提,不是模型强不强、算力够不够,而是你的数据到底有没有从"电子记录"变成能被调用来解决问题的资产。数据治理的本质不是技术问题,是组织问题——谁来定义标准、谁来保证质量、谁来打破部门间的数据壁垒。这三个问题不回答清楚,后面上再多的AI应用都是在沙滩上盖楼。