2003年,英国学者安德鲁·帕克提出了一个理论来解释寒武纪的生命大爆发,轰动国际古生物界。
5亿4400万年前,地球上的物种在一两千万年里突然密集涌现,在生物演化史上近千分之一的时间里,几乎现今所有动物的祖先都蜂拥而出。3个动物门的物种突然变成了38个动物门。这些生物仿佛是在寒武纪突然冒出来一样,大量的较高等生物出现,物种多样性极大丰富,它被形象地称为“寒武纪生命大爆发”。
安德鲁·帕克提出的假设是,第一双眼睛的诞生驱动了寒武纪的大爆发。视觉让生物能够辨识周围其他的动物,生物凭借视觉成为最敏捷的猎物,同时又能躲过其他动物的攻击。“看见”这个行为的存在,让动物们开始主动捕食。动物们成为猎食者,同时也成为被掠食的对象。追踪和躲避的游戏越来越复杂,由此,一场大型的生物演化军备竞赛爆发。
在安德鲁·帕克的理论中,视觉推动了地球生物演化里的关键进程,某种程度上也决定了今天的物种格局。
现代医学则发现,视觉是人类最重要的感知方式,为人类提供了关于环境的大量信息,在人类与周边环境的交互里发挥重要作用。生物体获取的所有外界信息中,视觉信息占有很大的比例,高等动物中这一现象尤其明显,一个正常人的感觉信息中七成以上来自视觉信息。
到了数字时代,在原子与比特世界的交融过程中,数据科学家们和工程师们也在试图赋予机器和设备以智能,而视觉能力自然成为学界和工业界探索的重要技术分支之一。
一只机械手迟缓又准确地锁定了门把手,经过短暂的停顿后,它打开房门。2018年2月,波士顿动力释放出的影片内容,该公司研发的动力平衡四足机器人已经具备了识别周边环境和障碍,打开门锁的能力。短暂的停顿,是这只四足机器人的计算系统在高速运转,它成功定位“看”到了门把手,发出旋转门把手的指令,最终,门打开,它走了出去。在这个过程中,视觉是这只四足机器人的机器智能中最重要的组成部分之一。
机器具备视觉能力不只发生在波士顿动力的机器人身上。在工厂的车间里,这些能力正以普通人难以想象的速度扩张。据高工机器人网报告,中国正在成为世界机器视觉发展最活跃的地区之一,应用范围几乎涵盖了国民经济中的各个领域。
视觉能力应用于工业生产也越来越普遍,工厂生产线上的设备装备“视觉”能力已不是新鲜事。例如,亿级像素水平的智能相机正应用于3C数码的屏幕检测环节,人眼难以识别的许多瑕疵和人力难以完成的全检都通过这些设备和算法成为现实。
另外,借助具备“视觉”能力的设备,车间与操作环节的人还能“看见”当下的物理世界并不存在的信息,例如远在几千公里之外的操作现场、需要巡检和点检的设备流程或操作指南。
探讨和追踪一种技术在中国工业界里的应用实践过程,最可被观察的是开发和使用这些技术的商业公司的成长之路。
由于对未来生产的关注,探讨视觉能力限定在工业视觉领域。中国企业在这一领域里真正起步从21世纪初开始,与改革开放以来的所有制造行业的发展历程相似,在生产制造数字化第一线,中国的企业们也经历了从国外企业主导到逐步实现国产替代的历程。
从核心零部件进口到重要领域实现国产替代,这条路的艰辛不言而喻。以海康机器人为例,他们2015年开始进入工业视觉领域,正是以核心的元器件的创新为目标而前进的。但即使当下业务进展颇快,一些高端产品中国品牌的突围依然有很长的路要走。中国快速发展的光伏、电子和半导体产业成了民族品牌实现技术进化的最佳试验场。这印证了那句话:市场和应用本身是技术进步最好的演化之地。
如果将工厂视作一个整体,机器视觉和工业视觉只是它的智能化提升工具包中若干工具之一。工厂当下的智能和计算力应用水平依然有待提升,而从零散的单点智能到终极智能是一条看不到终点的路。
工业化的进程以极快的速度推进的中国,企业的发展阶段大不相同。在这片土地上存在着几十座灯塔工厂,一些大型企业的黑灯工厂里机器人和自动化、智能化设备正以世界领先的姿态探索行业最前沿的课题。但离这些灯塔工厂仅仅一墙之隔的地方分布着的可能却是以劳动密集型和原始的方式管理的工厂,那里的信息化建设尚不完备,数字化技术的应用是与信息化补课同时开始的。
建新城易,改老城难。海尔的智慧工厂方案对外输出团队则发现了在这种撕扯和拉锯中一些企业的新动向。既然改造旧河山如此艰难,一些企业家们在绿色环保要求和人力成本上升压力共同作用下,利用工厂向中西部转移的契机开始企业内部的数字化顶层设计。这可能给中国的产业分布带来新的景象,中西部可能并不只是从东部转移而来的劳动密集型产业的承接之地。
参差百态,乃世界本源,这也是中国工厂智能之路的现实。
从人眼看见到机器视觉历史上没有任何一种形态的社会,曾经出现过这么集中的影像,这么密集的视觉信息。
——英国艺术批评家约翰·伯格
自物理学家开普勒发现视觉的光学机制已经过去了几百年光阴。光线穿过人的眼角膜、玻璃状液和晶状体到视网膜,这一过程随着现代医学和生理学的发展,被还原成越来越细致的过程。人们也越来越能从生理构造层面来理解视觉能力的产生机制。
人的眼睛能看见,本质是视神经接收电磁信号的过程。现代生物学和生理学发现,人的肉眼能看到极小波长范围内的电磁辐射,大致从380纳米(人眼中的紫色)到750纳米(人眼中的红色)。而人之所以能看见这段光,是人类的眼球结构,使得人眼的感知能力极为精细,对光的敏感度高。眼球后壁组织内发育出的四种特殊神经细胞,其中包括三种视锥细胞和一种视杆细胞。这四种细胞都对光敏感,都可以吸收电磁能量,并将之转化为信号传向脑部。神经生物学的研究显示,人类的视网膜中有视锥细胞600万~800万个,视杆细胞1亿个以上。三种视锥细胞对红、绿、蓝频段的光最为敏感。
光进入眼睛时,也是视锥细胞迅速做出反应,向脑部发送信号,随后大脑对接收的信号进行综合处理——首先找到物体的边缘(颜色反差极大的区域),然后用颜色细节填充其余部分,于是人会知道自己看到了什么。而视感细胞比视锥细胞敏感,它们在光线昏暗的时候发挥作用。只要有光子进入眼睛,视杆细胞就会做出反应,它决定了人的夜视能力。视杆细胞唤醒的速度比视锥细胞慢得多,所以导致人走入黑屋子时,视锥细胞得不到足够的光线,无法正常运作,视杆细胞则需要时间激活。几分钟后,视杆细胞开始运作了,但它看不见颜色,只能看出亮度的差异。
同时,从生理层面也能找到视觉能力在人体感官能力中占据优势的根源。相比听觉系统而言,视神经的神经末梢比耳蜗神经多出18倍,它吸收信息的速度比任何感觉器官都更快速。
现代行为学和心理学的发展还发现,有些时候,视觉可能在以人类无法意识到的方式影响着人类的智能和决策。
1957年,美国一家广告公司的老板詹姆斯·维卡里(James Vicary)对外公布,在新泽西州的一家电影院里,电影《野宴》(PICNIC)放映到某个场景时,电影院里的观众们都涌现出想吃爆米花、喝可乐的冲动。电影结束后,影院里可口可乐消费量增加了六分之一,爆米花消费量增加了一半以上。维卡里称原因在于他的创造性的打广告的方式。用一个特殊的装置,每隔五秒在屏幕上以三千分之一秒的速度播放“喝可乐”“吃爆米花”等文字信息。
依据当时科学界的理论,有意识的头脑实际上“看”到的总是他眼睛中见到的事物中的一部分。电影屏幕上打上喝可口可乐等字样,这些字闪现速度太快,字迹又浅,即使人们有意识的眼睛都没能注意到加在屏幕上的这些信息,甚至连那些事先知道将有此信息出现的人也没能看见它。但维卡里称它对促销和影响消费者行为能带来惊人的效果。这就是“阈下广告”的诞生。
维卡里的“发明”后来虽然被发现是夸大其词,但阈下广告的惊人效果却成为业界共识。阈下广告的存在本身让人意识到,人眼对信息的捕捉能力和视觉信息对行为的影响不可小觑。
哲学家、艺术批评家、心理学家们也不吝从哲学、文化、社会学等各种层面来解析视觉和背后的权力结构。在不同的历史时期人们用不同的方式围绕视觉这个主题阐述和表达,建构和解构“观看”这个动作。
心理学先驱人物弗洛伊德论述“人类文明开端”时提及视觉在人类文明发展中的重要影响。弗洛伊德认为,当人类直立起来后,作为获取性刺激和其他信息主要来源的嗅觉作用受到抑制,视觉获得了优先权并得到提高。身体是道德起源之所,正是直立姿式让人产生了羞耻感,开始了人类文明历程的决定性进展。
康德在论述其历史哲学中提及“视觉”在人性层面的重要影响。他认为,人体直立带来连锁反应:人站立起来了,人说话了,有了羞耻感和理智,在人性方面也就具有了伦理的、形而上学的、宗教的潜能,自此“绝对优势不再属于嗅觉,而是属于视觉”。嗅觉受抑,视觉提高,康德从中看到,人越是摆脱感觉和感性,就越成其为人。
1970年的纪录片《观看之道》从视觉生产角度来解析艺术背后的权力。大众媒体称这部纪录片建构了一整套现代人的观看体系,批判了资本主义视觉生产和消费。作者约翰·伯格将视觉与行为背后的权力构造相挂钩,审视了“观看”本身。视觉和“观看”被再三阐述和表达侧面,反映了视觉及与之相关的观看行为在人类社会中的重要性。
但另一方面,人的生理结构却存在固有局限。例如捕捉光线的能力需要反应时间,人类要对看到的东西做出反应需要0.2秒。生活中能见到的最快事件在毫秒级,一只家蝇每3毫秒即可拍动一次翅膀,这是人眼难以捕捉到的动作。
另外,视觉能看到的光波只是整个光谱的一小部分,不到百分之一的范围。许多昆虫和其他动物都可以看到的紫外光就不在人眼捕捉范围内。人眼聚焦距离的能力也很弱,受光线条件限制明显。
大多数时候超过人眼捕捉上限的“观看”被交由相机来辅助完成。普通的傻瓜相机在光线良好的情况下快门时间能毫不费劲地捕捉家蝇扇动翅膀的瞬间。此外,人类还发明了不少捕捉工具。这些人眼无法识别的过程通过工具被凝固下来,帮助人类完成“看见”这一行为。
比照相机和摄像设备走得更远的是应用于工业生产、仓储管理和军事机器人等领域里的视觉能力。这种被法国哲学家保罗·维利里奥称为“不用目光就能获得一种视觉的可能”。
“视觉”开始被赋予到物体和机器之中,视频摄像机将服从一台计算机,这台计算机为机器而不是为某位电影观众承担对周边环境的分析能力。机器的视觉能够识别形状的轮廓,能够全面解释视觉场域,解释场面调度,靠近或远离复杂环境的场面调度。
哲学家们从人的主体性丧失的角度对这种“视觉机器”充满警惕。不过从技术和经济逻辑,让机器具备感知外界的能力,在效率提升和社会福祉增加层面却颇具诱惑力。正是生产力提升驱动着机器视觉相关的学科和研究逐步发展,工业视觉技术逐步从实验室走向工业生产。
为什么工业需要“视觉”行业里普遍将机器视觉领域的历史追溯到上世纪中叶。早期研究从统计模式识别开始,主要聚焦于二维图像分析与识别,如光学字符识别OCR(Optical Character Recognition)、工件表面图片分析、显微图片和航空图片分析与解释等。
上世纪六七十年代是产业萌芽的阶段。在60年代对机器视觉的理解开始延伸到三维场景,科学家开始尝试研究三维机器视觉,用计算机程序从数字图像中提取诸如立方体、锲形体、棱柱体等多面体的三维结构,并对物体形状及物体空间关系进行描述。
1969年发生了一件大事,第一片CCD图像传感器在美国贝尔实验室诞生,从此图像可以被转成数字信号参与计算和分析。《机器视觉发展白皮书》将这一事件视作机器视觉发展的起点,“为机器植入眼睛”从此成为可能。
20世纪70年代这一领域出现了一些视觉运动系统,同时,美国麻省理工学院的人工智能实验室正式开设“机器视觉”的课程,大批学者开始参与相关理论和算法的研究。1977年,David Marr教授在麻省理工学院的人工智能实验室领导研究小组,提出了不同于此前的分析方法的计算视觉理论,将视觉分为目标与策略、表示与算法、硬件的实现三个层次。机器视觉迎来了第一次理论框架的升级,该理论在80年代成为机器视觉研究领域中重要的理论框架。
在产业的萌芽期,受限于半导体工艺成熟度和成本等因素,机器视觉只在高端科学研究和航天、军工项目中有少量初级应用。
上世纪80年代之后,一批机器视觉企业纷纷成立,今天在机器视觉算法领域表现卓越的康耐视就是在这一阶段诞生的。进入上世纪90年代,随着机器视觉技术在一些行业如半导体产业里的应用,产业本身得到了蓬勃发展。在这一阶段,成像技术和算法算力都限制了机器视觉技术向更广泛的行业做全面推广。
进入新世纪之后,应用更加丰富,算力得到了提升,汽车、半导体和3C电子产业对机器视觉技术应用的需求增大。尤其是AI算法的发展,促使机器视觉技术在消费电子、汽车制造、光伏半导体等多个行业应用更加广泛。
赋予机器设备以视觉能力,在概念上有人称之为“机器视觉”,也有人用“计算机视觉”一词,业界也不乏辨析这两个概念的不同。综合来看,计算机视觉偏重采用图像处理、模式识别、人工智能技术相结合的手段,着重于一幅或多幅图像的计算机分析。
根据美国制造工程师协会(SME)机器视觉分会和美国机器人工业协会(RIA)自动化视觉分会关于机器视觉的定义,机器视觉是通过光学的装置和非接触的传感器,自动地接收和处理一个真实物体的图像,以获得所需信息或用于控制机器人运动的装置。
通俗地说,机器视觉就是用机器代替人眼,模拟眼睛进行图像采集,经过图像识别和处理提取信息,最终通过执行装置完成操作。相比计算机视觉,机器视觉偏重于计算机视觉技术工程化,能够自动获取和分析特定的图像,以控制相应的行为。计算机视觉为机器视觉提供图像和景物分析的理论和算法基础,机器视觉为计算机视觉的实现提供传感器模型、系统构造和实现手段。
在本书中,我们重点探讨的是视觉能力在工业生产领域的应用,故使用“机器视觉应用于工业场景”等带有限定词的表述,以剔除安防等应用场景。此外也使用比“机器视觉”所指更为狭窄的“工业视觉”一词,以缩小讨论范围。
机器视觉技术使工业设备能够“看到”它正在进行的操作,并根据它所看到的情况做出快速的决策,这是机器视觉技术在工业场景中得以应用的目标与原因。
相比人眼存在生理上的限制而言,机器不会感到疲倦,因此它们可以比人类的眼睛更快且更可靠地发现问题。人眼的识别对光线、速度和范围都有要求,机器也不受人类视觉能力极限的约束,可根据需求“观察”到更多有用信息。
例如钢材产线的质检环节里,钢铸板坯在生产中的即时检测是人眼很难完成的任务,因为现场温度极高。一些板坯的铸造过程中,钢材尚未完全冷却时,温度可以达到600~1100℃。即时检测中能够留给检测者“观察”这些放置于产线轨道上的钢板时间也极短,因为行进中的输送钢板的辊道速度每分钟可能达到60米。而对需要检测出来的瑕疵的定义可能也非常苛刻,钢铸板坯上的一些划伤或者小裂纹宽度只要超过1毫米可能就算瑕疵品。
这个场景如果采用人眼检测,首先可能要等待钢材冷却,因为温度高不适合人力作业。其次人眼很难发现这些宽度仅为1毫米的痕迹,有极大的概率出现漏掉瑕疵品的情况,对高精度钢材的质量稳定性而言这是致命的生产漏洞。另外,人眼检查瑕疵时钢材传送的速度会降到极低的水平,很难实现大规模复现,因而生产效率极低。
超越人眼能力的极限,批量大且重复性强的作业在工业场景里并不鲜见。通过机器视觉技术,人可以从这些繁重、危险又复杂的环境中解放出来,制造效率能得到显著提升。由此,机器视觉在工业中的应用具备了必要性。
工业视觉与人眼能力对比
资料来源:产业网,太平洋研究院整理。
除了在可见光场景里,机器视觉还可以利用专用的热成像来检测热异常,也可以使用X射线,从而覆盖非可见光场景,发现更多微观信息。这也增加了它在工业场景里应用的可能性。
机器视觉应用于工业生产对比同等条件下的人工作业,可能还意味着成本优势。在生育率下降、劳动人口减少的社会大背景下,这也能帮助企业更好应对当下国内制造业招工难的问题。
2021年第七次全国人口普查显示,16~59岁劳动年龄人口为8.8亿人,与2010年第六次全国人口普查相比,我国劳动年龄人口减少了4000多万人。另据国家统计局发布的农民工监测调查报告,2020年从事第二产业的农民工比重为48.1%,比上年下降0.5个百分点。其中,从事制造业的农民工比重为27.3%,比上年下降0.1个百分点。
这些数据意味着,虽然中国整体性的人口红利依然存在,但相比十年前已呈逐渐萎缩的趋势。招工难导致制造业里整体薪资水平也逐步提高,对行业从业者而言是一大利好,对企业经营者而言则会带来更大的成本压力。
在这一背景下,企业经营者也有动力在生产环节推广和使用机器视觉技术。这些技术替代人力,也降低了员工易流失带来的岗位人员不稳定和生产效率不稳定。国内的一家人工智能企业创新奇智的工业视觉产品团队曾统计过,在电子制造行业相关生产线上与视觉检测有关的工种每年人工成本达到了惊人的60亿元。而通过机器智能和工业视觉技术改造,视觉检测这一工序成本可能会出现下降。
投资机构太平洋证券的研究团队则测算过,在发达国家,一个典型的1万美元机器视觉系统应用可以替代3个年工资在2万美元左右的工人,投入回收期非常短,且后续维护费用较低,具备明显的经济性。随着国内人工成本上涨,对经济性的追求同样会推动机器视觉在国内工业场景里的渗透率快速提升。
一些数字化转型的标杆企业在对外披露自身的探索经验时,“机器换人”带来的效益提升经常作为亮点出现。
以国内的家电品牌老板电器为例,在它的一条位于浙江杭州的生产线上,集烟罩自动冲压成型环节已经实现了机器自动化作业,车间的工作很少需要人力参与。老板电器对外披露,在它们打造的5万平方米的车间里,布设了一系列的智能设备,包括284台自动化设备、16条生产线以及27台AGV小车等。对人力的替代最明显的岗位包含了质检员,一篇解析老板电器数字化经验的文章中提及,过去老板电器里工厂可能需要10个质检员盯着,由于机器视觉技术的应用,质检员的数量只需一两个。
无独有偶,在调研家居品牌顾家家居的全屋定制柜类产品生产线时,我们也发现了应用智能手段对提升工厂生产效率、增加产品稳定性、缩短作业周期具有显著效果。该生产线2021年9月投入使用,在开料、封边、钻孔和分拣包装等多个环节都采用了高度自动化的设备与技术来参与生产。其中在开料环节,每块板材都会附带可追踪订单情况的二维码标签,进一步明确每块板材的订单序号、生产批次、开料时间等信息;通过一板一扫的严格操作,智能设备会根据板材的加工需求自动调整设备参数,确保板材的加工精度。分拣包装环节亦是如此,智能机械手臂会根据板材匹配的订单信息有序地完成智能分拣分包,智能包装生产线实现自动码垛、智能裁剪、打包堆叠一体化的包装流程。
顾家全屋定制工厂负责人胡柱彬介绍,高度自动化设备的引进,在很大程度上降低了传统生产对人工的高度依赖。据估算,顾家全屋定制因全新设备与技术的升级引进,一套普通柜子的生产周期可以从传统的3天缩短至1天,大幅度缩短生产周期,提升全屋定制工厂整体的生产效率,让产品加工具备更高的稳定性。
图片来源:顾家家居。
顾家全屋定制生产研发基地生产流程之智能分拣
在三一重工的灯塔工厂,位于湖南省长沙市的18号工厂里,我们同样看到了大规模的自动化、数字化技术也在应用到工厂生产一线。生产线上从钢板到零部件都能无人化生产,智能车间里四处密布的“数据点位”,使具备工业视觉能力的设备可以做到从焊接到分拣、喷涂、运输、调试都自动化、智能化。
这些数字化车间是工业视觉的第一线,对人工依赖度逐渐降低的智能工厂能够成为现实,机器视觉是其智能的重要组成部分。工厂各个角落里安装着工业摄像头和其他物联网设备,成为智能工厂大脑决策的“毛细血管”和获取信息的“触手”。
另外,随着制造业从机械化向自动化、智能化的升级,生产过程的要求越来越高,更精确、更高效才能带来更低的成本和更合乎要求的产品。从制造升级为智造,这是中国当下制造企业整体升级转型的目标,也是当下激烈的市场竞争中企业获得更大生存空间、赢得主动权的杀手锏。视觉检测这一工序,采用了工业视觉应用,从较粗放、难量化的劳动密集型工位升级为可精准定量、可完整溯源、可智能集成数据的全自动工位,从而带来生产效率和产品质量的大幅提升。
天风证券的研究团队认为,工业视觉是5G工业的眼睛,是实现工业智能化、数据化的关键,也是未来工业生产最重要的数据入口。投资机构太平洋证券在一份研究报告中则指出,机器换人和技术进步带来的需求正让机器视觉在智能制造里的位置从“可选项”走向了“必选项”。
机器视觉系统正作为机器智能的信息输入和感知端口,在工业环节扮演着越来越重要的角色。
超级视野:工业视觉能做什么2020年8月,小米在其成立10周年特别活动上公开了投资建设的“黑灯工厂”,并宣布小米手机实现无人化生产。生产小米手机的工厂是一座从生产管理、机械加工到包装储运实现了全程自动化、无人生产的“黑灯工厂”。
在这个工厂里,物料的运输由工业移动机器人AGV小车完成,搬运、上下料都靠它,系统在材料存放地和目的地之间设置好路径,AGV小车就在既定的路径上往返穿梭。智能机器臂完成上下料以及各种精细操作,质量检测也交由机器完成。
如同老板电器的未来工厂一样,在小米的黑灯工厂,机器视觉技术的存在和重要性不言而喻,机器视觉在工业生产中的角色和功能在这些工厂里得到了充分的体现。例如,AGV小车离不开工业视觉的定位应用,质检环节应用到了工业视觉的外观检测功能。
目前业界将机器视觉在工业生产环节的典型应用分为四类,分别是产品识别/计数、视觉定位、尺寸测量和外观检测。太平洋证券在一份研究报告里对这四种应用的场景做过详细界定,它们的实现难度呈依次递增趋势。
识别是视觉最基础的功能之一。在工业环境下识别主要用于对已知规律的物品进行分辨,比较容易的包含外形、颜色、图案、数字、条码等识别,也有信息量更大或更抽象的识别如人脸、指纹、虹膜识别等。视觉定位主要指在识别物体的基础上精确给出物体的坐标和角度信息。定位在机器视觉应用中是非常基础且核心的功能。尺寸测量指把获取的图像像素信息标定成常用的度量衡单位,然后在图像中精确地计算出需要知道的几何尺寸。外观检测主要检测产品的外观缺陷,最常见的包括表面装配缺陷(如漏装、混料、错配等)、表面印刷缺陷(如多印、漏印、重印等)以及表面形状缺陷(如崩边、凸起、凹坑等)。由于产品外观缺陷一般情况下种类繁杂,外观检测在机器视觉中的应用属于相对较难的一类。
资料来源:奥普特官网,东吴证券研究所。
机器视觉广泛适用于动力电池生产的各个环节
这四大应用目前在电子、半导体及光伏新能源、汽车制造、食品包装、制药等多个行业都已经逐步推广。
另外,工业视觉功能的实现也依赖算法的支持。近年来随着机器视觉的应用范围逐步扩大,一些随机性强、特征复杂的任务场景,例如随机出现的复杂外观检测,就需要使用能定义和识别复杂特征的算法。事实上,计算机视觉在这一领域也有多年的积累,引领计算机视觉飞速发展的传奇视觉数据库ImageNet成了不能被忽略的存在。
2007年华人科学家李飞飞组织团队开启ImageNet项目,2009年ImageNet正式发布。当时学界都在探讨算法的重要性,数据的价值却被忽视。李飞飞团队开启ImageNet的目的是从数据层面提升计算机对物体的识别能力。李飞飞团队通过大量的手动标注和分类,建立一个大型数据额数据集,方便计算机进行视觉识别研究。(2012年《纽约时报》报道该数据集标注过的图片达1400万张,从黑曜石到猩猩再到豹猫,2万多种类别、形形色色的对象都被一一标注。)
2010年开始,基于ImageNet数据集的大规模视觉识别挑战赛(ILSVRC)每年举行,这项赛事成了展示和筛选计算机算法的最佳舞台。从2010年到2017年,挑战赛的目标识别错误率一直在下降。2015年时,机器识别图片的错误率已经达到甚至低于人类水平,2016年图像识别错误率已经达到约2.9%,远远超越人类的视觉能力(图像识别错误率5.1%)。
当下AI领域大热的深度学习算法则是从2012年开始展示出存在感。2012年计算机学家Geoffrey Hinton在挑战赛中用深度卷积神经网络结构来构建模型,结果它识别图片的能力一骑绝尘,足足提升了10.8%的性能,比第二名的成绩高出41%。此后深度学习算法开始风靡业界,科技巨头们纷纷在这一领域发力。
目前一些大型的互联网公司的人工智能团队也在利用AI算法来解决复杂的识别和检测难题,阿里、百度等头部互联网巨头都曾经披露过相关案例。以阿里云为例,2018年开始,他们与攀钢集团旗下的西昌钢钒炼钢厂合作,通过人工智能技术,实现冷轧板材表面AI检测。这个环节此前由人工完成,质检员的任务是在5~10分钟的时间里,用肉眼识别出少则十几个、多则上百个缺陷,并在表检仪(表面检测设备)扫描完毕的30秒之内给出表面等级、分选度、主缺陷和是否合格等判定。由于操作员易疲劳、经验差异等客观条件限制,此前的检测结果存在不稳定因素,这会导致交付客户的产品质量也不稳定。
在阿里云对外披露的技术细节里,技术团队构建了表检场景里的表面质量自动判定模型,先将几千种产品外观缺陷归纳为60~70大类,之后通过模型训练,利用深度学习技术,对轧钢分级进行初步判定,最终反馈出结果。这一结果辅助人工判断产品缺陷,降低了人工依赖性,提高了判定准确率。
可以说,在这些工业场景里,计算机视觉和机器视觉技术的融合,大大突破了人类的视觉限制。
华为的智库团队在2019年发布的一份报告里预测2025年的十大中长期趋势,超级视野被列入其中。人类将进入超级视野时代,这意味着通过VR、机器学习等新技术使能的超级视野,帮助人类突破距离、表象、时间和模糊等的局限,赋予人类新的能力。事实上,这四大突破在工业场景里已经是现实。
机器视觉能够突破表象,通过特殊的传感器来“看见”有机体内部状态,如在不破坏水果表皮的情况下查看水果内部的状况。
机器也能突破空间限制,让人类变成“千里眼”,将千里之外的现场拉到眼前。AR眼镜就是这种神奇的存在。它能让原本不在该时空的人员借助物理在场者的第一视觉眼镜视域共享,实现对现场信息的掌控和把握。工业场景里远程的维修和巡检也因此突破时空限制,成为可能。这是另一种形式的“看见”。
机器视觉还能让人看见现实世界并不存在的信息,辅助知识库调用、便利产线点巡检、辅助操作员完成装配等。目前,国内的AR眼镜研发企业如杭州的ROKID公司推出的产品可以实现对物理环境进行标记,这些原本不存在于物体之上的虚拟信息标记,实时反馈在人的眼前,助力设备巡检等多个场景。
通过佩戴AR眼镜,物理世界并不存在的步骤流程信息、作业的流程和内容都被标准化。操作者只需要按照这些被固化的可视化流程操作,就能保证工序流程不出现错漏,从而保证生产规范性。据ROKID公司对外披露的信息,汽配行业里不少企业如比亚迪、三一重工等都已经将这种AR扩展后的视觉能力应用到了生产环节。
总之,机器视觉能力应用到工业中,人类仿佛具备了超级视野,千里眼、透视等能力都成为现实。
中国工业视觉的市场特征工业视觉要“看”清制造场景,“感知”和“理解”关键信息,首先需要合适的光源和传感器来获取真实物体的图像。被测物品会反射光源的光线,经过镜头折射在感光传感器(CCD或CMOS)上产生模拟电流信号,而后转换成数字信号传递给图像处理器,得到图像后通过工业相机通信接口,传入计算机中进行图像处理分析。计算机从图像中提取信息,经过分析、处理,最终返回控制机器运动的指令。
一个典型的机器视觉系统包括:光源、镜头、相机(CCD或COMS相机)、图像采集卡、图像处理软件等,在这个过程中,专业的硬件和软件都不可或缺。
工业相机负责捕捉和分析对象,本质是将光信号变成电信号,要求产品有较高的传输力、抗干扰能力以及稳定的成像能力,这也是工业视觉系统的核心零部件。镜头是清晰成像的核心,光源设计光路实现目标成像,图像处理软件通过算法完成对被测物的识别、定位、测量、检测等功能。目前国内企业介入工业视觉产业链条主要也是从硬件生产、软件开发和系统集成等层面出发。
国内大型券商的研究团队对本土企业在产业链条上的分布基本都从光源、镜头、工业相机和视觉分析软件四个维度来观察。光源目前是国内视觉产业链条里国产化率最高的环节,市场竞争颇为激烈,代表玩家有奥普特、纬朗光电、沃德普和康视达等。高端镜头领域海外企业起步较早,整体处于领先地位,本土厂商多以中低端市场为切入点。工业相机此前也被国外企业占据市场,本土企业近年来正努力实现中低端市场的国产进口替代。同样的情况也出现在视觉分析软件上,国内仅有少数企业拥有独立的底层算法库。
这与国内机器视觉行业的起步方式有关。作为一个舶来的行业,国内这个产业的起步是伴随着国内半导体产业链及高端设备的引入而进入国内公众视野的。1995年半导体集成电路行业的“九零工程”开始,国内半导体集成电路行业开始建设自己的晶圆产线,众多电子和半导体工厂落户广东和上海,服务于半导体链条的机器视觉技术开始被引进国内,国际机器视觉厂商也纷纷在国内设立代理。正是对海外巨头的产品应用和集成,培养出了国内机器视觉领域的第一批从业者。这一路径与中国制造其他领域的成长如出一辙。
中国企业在机器视觉领域的国产替代之路客观上最大的利好在于,这是一个在全球都发展颇为迅猛的产业,中国市场的成长速度更加惊人。
根据国外调研机构Markets and Markets数据,2010年全球机器视觉市场规模为31.7亿美元,到2020年增长至96亿美元。该机构预测,到2025年全球机器视觉市场规模将突破130亿美元。而中国市场的成长速度高出国际水平。据中国机器视觉产业联盟统计,2020年中国机器视觉行业规模约113亿元,较2015年的31亿元增长了2.6倍,复合年均增长率远高于全球机器视觉行业同期水平,2025年国内机器视觉行业规模有望达到288亿元。
随着制造业从机械化向自动化再向智能化升级,在智能制造大趋势及技术更替的背景下,同时中国又是全球最大的工业制造国,机器视觉行业领域在相当长的一段时间里的成长性是可预见的。
同时,中国的机器视觉领域的市场渗透率仍有待提升,这意味着这个领域依然有市场空间等待释放。东吴证券在一份研报里对比机器视觉产业和我国制造业整体在全球的占比,机器视觉领域的占比相对而言呈较低水平。2018年我国机器视觉产值占比仅为14.68%,与全球制造中心的地位不匹配,且跨国巨头基恩士和康耐视来自大中华区的收入占比也落后于欧美地区。机器视觉渗透率仍不算高,有较大成长空间,但即使如此,目前我国已是继美国、日本的第三大机器视觉领域应用市场。
中国企业的国产替代还有很长的路要走,最大的痛点来自这个行业的分散特性。机器视觉作为一个纵向的支撑性技术,行业整体的体量不算惊人,市场却颇为零散。
研究机构将行业的最大痛点定位为应用场景和检测需求的碎片化和非标准化。这种碎片化和非标准化导致了各领域之间的技术往往难以直接替代。国海证券在一份研报里举例称,消费电子行业的机器视觉产品无法直接应用于汽车制造行业,即使在消费电子行业内部,对手机玻璃的检测也不能直接应用到手机外壳的检测上。甚至在手机玻璃检测的内部,为某一家客户研发的设备也很难原封不动地提供给另一家客户使用。所以,该市场研究团队认为,在机器视觉行业内很难出现单一的、宽广的应用场景,各单一应用领域的体量都比较小。
这种零散化的市场还带来了另一个问题:行业里的参与者体量很难做大。据前瞻产业研究院数据,截至2020年底,我国涉及机器视觉相关产业的企业已超过4000家,数量十分庞大,但据CMVU数据,其中营收规模在3000万元以下的企业数量过半,营收规模超过1亿元的企业仅为16%。本土机器视觉企业仍以中小企业为主。东吴证券的研究团队对比了国外巨头和国内企业的市场占有率,2019年基恩士、康耐视在华市场占有率分别约为37%和7%,位居前二,国产机器视觉龙头奥普特市场占有率约5%。小而不强是本土机器视觉企业的最大现状。
海康机器人:走一条创新突破之路我们调研海康机器人公司时从该公司的成长历程中感受到了企业在先进制造业市场生存的不易。海康机器人隶属智能物联龙头企业海康威视,近年来在移动机器人和工业视觉领域发展势头强劲。它在工业视觉领域的起步始于2014年9月,工业视觉团队负责人张文聪博士介绍,从创立之初这支团队就希望能够实现核心技术的自主创新。
海康的工业视觉团队选择从相机和算法两大领域出发,一方面坚持工业相机的研发,另一方面针对碎片化市场做算法工具包的开发。张文聪博士介绍,工业相机是自动化设备的眼睛,产品对稳定性要求极高,要求延迟时间短且稳定,不能出现数据上的波动,另外传输时也不能出现丢包,这对技术和产品研发提出了极高的挑战。
除了技术层面的困难,由于应用场景零碎,涉及的相机种类很多,单个产品的前期研发投入不小,但最终产品的营收可能并不高。这导致了新兴品牌要在工业相机领域打开局面颇为困难。正是在这种背景下,在海康机器人进入这个领域时,行业里八成以上的工业相机是依赖国外进口,国内厂商更多是做视觉集成应用。
2014年9月,海康机器人开始起步,到2015年底时,第一台工业相机研发成功。为了应对碎片化的应用场景,海康机器人的工业视觉团队以极快的速度迭代,从最小分辨率的30万像素到6亿像素,分辨率的型号达到上百种。帧率从每秒几帧的产品到每秒上千帧的产品,实现了产品型号上的覆盖。到2019年时,这个团队实现了工业相机市场保有量突破100万个的记录。
要实现这一跨越,难度不言而喻。在先进制造业中,新进厂商最大的困境除了技术研发层面的困难,更大的拦路虎在于批量供货的稳定性。许多新进厂商的瓶颈也在这里,一些企业的产品研发出来后,大规模生产环节要么出现质量问题,要么难以稳定快速交付。张文聪称,海康机器人的工业视觉产品之所以表现不俗,在于供应链和生产端的管控能力,能够以更可控的成本实现高质量稳定供货。
我们在海康威视的桐庐智能工厂里窥见了这种生产端的能力。海康威视的供应链中心工程技术部负责人李亮称之为柔性生产能力。他介绍,海康威视的生产基地里需要生产的产品种类数千种、型号达到数万种,订单定配置比例颇高。
面对高度碎片化的市场和个性化的需求,他们在系统规划层面就为这种柔性生产能力做好了筹备。李亮介绍,工厂里的生产过程之间,不同的系统与生产设备实现了互联互通。他们打通了两个维度的数据流:一个是从产品开发到生产制造维度的工艺管理系统,涉及工艺层面的参数和知识管理;另一个是市场需求到订单交付维度的计划管理系统,涉及客户的定制需求与生产资源、物料的衔接。
一个来自市场的订单,要确保准时合格交付,首先要组织排产,在供应链层面保障生产物料资源充足,到制造执行时还需要按照正确的指令和工艺标准保质保量地生产出来。由于产品的种类多、型号多,每个订单都需要在制造执行时调用工艺管理系统里的数据,使产线流程生产出正确的产品。
正是这两大系统间的衔接和自如调用,保障了小批量、碎片化的订单都能被快速、高质量地生产出来。李亮说,许多工厂的订单种类少,工艺参数设置好后甚至会一年或几个月不变,但在海康的工厂生产线上每天可能要更换几次工艺参数。正是有一套智能化的系统数据支撑,才保障了产线的正常生产运转。
这种柔性生产能力的打造也离不开海康机器人自身研发的工业视觉产品。工厂内物流是生产流程里的重要环节,在海康的工厂随处可见搬运物料的移动机器人(AMR),它们基于订单排程和物料消耗进度,将物料自动配送至工位。这些智能的内物流系统,也提升了生产线上的柔性和自动化水平,让大规模定制成为可能。此外,智能视觉还扮演了产线的眼睛,指挥机器人自动装配,全自动检测,有效避免人工误判,提升质量一致性。
对制造业而言,市场从来都是最好的老师,庞大的国内市场是技术和产业最好的演练场。有人使用,一项技术和一个产业才有迭代的可能性,工艺的改进、成本的优化、良率的提升才能发生。当下工业视觉领域最大的几个下游市场如3C、新能源、电子半导体等产业在市场规模上逐年递增,这些产业的发展客观上也推动着国内工业视觉解决方案走向成熟。
以工业相机为例,产品技术上,国产厂商正稳步向着起步较早的海外厂商靠拢,大部分产品的技术水平和质量已不分伯仲,但国产品牌要建立普遍性的品牌效应仍需时日。
海康机器人的工业视觉团队遇到过类似的境况,张文聪就碰到过一些对使用国产方案仍有疑虑的客户。但张文聪也认为,产品力是品牌建立自身信誉最好的机会,产品质量和性能仍然是国内外厂商比拼的焦点。张文聪坦言,虽然业务已拓展到全球50多个国家及地区,但在不同地区,贴合本地化做业务是需要时间的。也只有通过市场上的应用和反馈、供应商和品牌长期的协作与磨合,才能生产更符合市场需求的产品,才能逐步在行业里建立声誉,这是一个相辅相成的过程。海康机器人在软件和硬件层面同时发力,通过系统化的技术布局和严格的质量管控,建立了与行业需求更适配的产品和技术体系。
总之,在先进制造业开疆拓土是一条漫长的路。工业视觉领域的新进品牌必须靠极强的进取心和坚定的目标意识、不偏离发展路线的践行能力,才能实现前方的星辰大海。
智能工厂没有标准答案工业视觉无疑推动了工厂的智能化发展,有人称它给工厂的机械安上了眼睛和大脑。不过要打造一座智能工厂,还需要工业视觉以外的大量能力。同时,在中国,建设一座智能化的工厂可能并不只是一个技术问题。
海尔卡奥斯工业互联网平台对外输出智能工厂方案的团队负责人荣亮发现,智能工厂的建设本身是一个颇为复合的领域,融合了机器视觉、5G通信、自动化控制、大数据、物联网、人工智能算法等多个学科的知识,并且智能工厂并不等同于无人工厂,“人”是智能制造的核心,在智能工厂内,人依然将发挥重要的控制和决策作用。而数字化变革的主体操盘手——广大中小制造企业的厂长和管理层们,经验多长于本行业的工厂运营及管理。他们中的许多人对工厂智能化的路径、解决方案缺乏明晰的认知,这为形形色色的智能工厂及工厂数字化改造方案提供商留下了市场空间。
研究机构Markets and Markets发布的报告显示,2021年全球智能工厂商场规模估计到达801亿美元,到2026年这一数据有望增至1349亿美元,年复合增长率达到11%。报告认为,推动市场增长的关键因素包括新冠肺炎疫情危机中保持制造设施正常运转的财政政策、资源优化以及生产运营成本的降低,从而使市场增长工业机器人的需求,工业环境中对物联网和人工智能等技术的需求不断增长,以及对能源效率的日益重视。
荣亮所在的团队就立足于这个方兴未艾的市场。海尔卡奥斯工业互联网平台对外输出智能工厂方案团队前身隶属于海尔的工程技术中心。伴随着海尔的业务扩张和成长路径,以及基于从“产销分离”到“产消合一”,满足用户无缝化、透明化、可视化最佳体验的创新探索,这个团队沉淀出了大量以大规模定制为核心的制造业数字化转型方案和方法论。
随着海尔内部的数字化需求度过迅猛增长的阶段,步入平稳发展期,他们开始探索将建设智能化工厂的经验对外输出的可能性,并通过持续对外的赋能实践,构建了智能工厂的业务模型体系。这也是一个在中国制造业数字化发展历程中留下了鲜明印记的团队。根据世界经济论坛公布的结果,截至2022年3月30日,中国“灯塔工厂”数量达37家,主要分布于3C电子、家电、汽车、钢铁、新能源等行业,中国是当今世界灯塔工厂最密集的区域。灯塔工厂的数量反映了中国企业对数字化的热情和动力,也反映了中国企业数字化在全球横向的水平。在这37座灯塔工厂中,荣亮所在的团队主导建设了5座灯塔工厂,其中包括海尔自身的4座灯塔工厂和1座外部客户的灯塔工厂。这种实战经验,为制造业首次提供了大规模定制转型的有益借鉴和示范,同时无疑让他们对中国的工厂数字化发展现状与症结有了切实的认知,也洞见了制造业数字化变革中遭遇的一些真问题。
在帮助制造业企业建设智能化工厂的过程中,荣亮和他的同事们经常会遭遇到的疑问是,制造业作为一个大的工业门类,涉及的细分行业众多,每个行业都有专业性和门槛,如何给不同的行业提供合适的智能工厂解决方案,真的存在标准化的解决方案吗?
这也是行业里的热门议题,我们调研过程中也收到过类似反馈。一些从业者颇为困扰的是,制造业的数字化变革或者说广义的工业互联网项目是一个注重交付的领域,如何沉淀可复用的知识?服务商们如何完成从提供定制化的解决方案到提供标准化产品的惊险一跃?学者林雪萍用“能量热沉”来描述这种现象,意为要找到能量不会随意扩散,而是可以吸收、消化在本地的点是最大的考验。
这是工业互联网平台和产业数字化方案提供商们商业模式的根基。当每一个项目都需要注重交付的贴身服务时,也意味着数字化解决方案提供者们耗费了大量的精力做定制化开发。一旦不能形成可复用的结构性的产品或解决方案,自然无法形成规模效应,企业的营收预测曲线和估值模型也难以套用科技公司的计算逻辑。
当下,数字化服务商如云计算巨头们往往以重服务、打造标杆客户的姿态介入大型企业的数字化改造过程,他们在服务大型企业过程中交付的系统和工具通常被视作被服务者的知识资产。这些数字化服务商们很难将标杆案例里的产品直接复用在新的客户身上。这使得每一个项目都变成了零碎化的非标准服务,庞大的市场很可能会被分割为一个又一个具体的项目,既碎片又零散,很难带来真正意义上的规模效应。
围绕着经验和服务能否沉淀出标准化产品的疑问,荣亮的答案是,在一些环节,企业的数字化改造是存在共性问题的。一方面,今天,制造业正遭遇共同的需求端和市场端剧变,订单的碎片化和零散化已经成为几乎所有行业的趋势。例如,他碰到过浙江一家做胶水的流程制造企业,不同的胶水配方有100多种,但最小的订单可能就几十公斤。为了生存,企业又不可能无视这些小批量、碎片化的订单,这意味着企业要常态化应对定制行为的大批量重复发生。同时网络、直播工具和各类连接平台让订单的可预测性也在降低,大量的需求可能会在极短的时间内产生,许多生产企业被迫要接受巨大的峰谷流量差异带来的供应链震荡。这些都是制造企业生存环境变革中的共性。想要活下来,企业就必须要具备系统重塑人员组织、运行方式和市场供求等变革能力,使生产系统能快速适应需求变化,同时精简生产过程中的冗余流程与消耗,实现最优生产。而现在,解决这些共性问题的答案荣亮团队已经找到了。
荣亮介绍,卡奥斯的智能工厂方案输出团队,输出的知识沉淀来自海尔多年的信息化、智能化改造实践的积累。这套经验已经形成了企业级的现场方法论,沉淀出了三大产品线,一个是互联工厂的建设方法论,一个是灯塔工厂的建设规划,一个是在具体指标上面提出三联三化的迹象性改造指标。这三大产品线的最终导向都是要将用户需求大规模接入智造全流程,并围绕用户最佳体验展开对定制、研发、营销、采购等七大节点的互联改造,重塑工厂角色,而这也为制造业的革新提供了底层的经验逻辑。即使制造业内部在生产工艺层面千差万别,但从企业管理来看,中国制造业里占比超半的离散型装配制造企业在管理层面遭遇的问题是类似的,海尔这样的家电巨头过往发展中沉淀出的解决方案也因此具有了一定的普适性。
许多有改造需求的企业,痛点与海尔15年前、10年前遇到的境况吻合,荣亮和团队能从海尔在全球多座互联工厂的成功建设经验里给出相应的解决方案,并且基于对企业生产组织和工作流程的颠覆重塑,解决企业实际需求。例如,一家企业找到荣亮团队的原因在于,工厂无法按照设计的产能生产产品,产品的交货期从预计的2个月延长到4个月。这家企业头痛的问题很快被荣亮和他的同事们分解为具体的知识点,从采购、产线管理、产销协同和产品设计层面都能找到办法来解决问题。
不过,他也承认,这套对外输出的现场方法论目前偏重提升企业管理效率层面,尚难深入每一个行业的制造工艺和生产场景。
一旦深入生产工艺领域,制造业细分门类的千差万别特性与行业门槛立即显现出来,解决方案提供商们又要再次纠结方案和知识的可复用性。作为大型工厂数字化改造项目的集成角色,荣亮服务客户的过程会调用和集成外部技术方案,如工业视觉能力、网络连通能力、人工智能算法工具等。他在寻找技术方案的合作伙伴时就会经常遇到技术提供方因为产品的可复用性,而不愿投入精力深入具体制造业的场景。
这种困扰的解决可能需要更标准化的系统性工具存在,通过相对标准的通用规则的建立,让更多应用方来完成具体场景里的产品开发和创新。在这些工具之外,还有发达的低代码开发环境,由具体行业里成长起来的产业从业者群体通过低代码解决工厂生产场景里的大量个性化的需求。
事实上,国内一些互联网平台的确正在尝试类似的做法。如从在线协同工具向应用开发平台转变的钉钉就希望通过搭建行业化的底座,利用设备上钉、计件日结等产品,以相对标准化的方式帮制造企业实现人和设备及不同业务系统间的连通,实现数据在企业内部的流转。它们希望这套方案搭配上低代码,随着平台里的应用生态的逐步完善,从而形成一套可适配、易拓展的数字生产力工具。
不可忽视的是这些尝试当下仍处于起步阶段,平台们要真正建立繁盛的生态仍需时日。
除了数字化方案提供者们必须面对的商业模式拷问,另一重难题来自行业性规范和标准的缺失。
目前,工厂智能化路径没有形成行业性的标准与范例,巨大的信息鸿沟横亘在数字化服务商和数字化转型实施企业之间。许多企业试图引入外部技术支持时常常发现自己陷入了技术参数与繁杂概念的汪洋大海之中。这些数字化方案的需求方一边困惑于企业的具体问题,又很难将自身的问题与市面上泛滥的技术、系统和方案间建立关联。另外,同样的需求还经常出现价格差异巨大的不同的解决方案,企业的试错成本也很高。即使形成行业性规范或标准,能否在全行业分享和交流也颇为可疑。在以工业know-how建立起竞争壁垒的领域,行业领先的技术和标准可能经常意味着竞争力,也是企业商业模式成立的基石,企业是否有动力对外分享行业标准需要打上问号。
另外,在制造业的数字化改造进程中,引入新的生产力,开始生产关系的变革可能还意味着企业组织架构层面的融合与重塑。既需要重新定义价值,也需要算细账,权衡投入产出比。一些大型制造业集团即使从企业战略层面来思考和看待数字化改造,也时常遭遇行动价值和投入产出比层面的挑战。
以国内某制造巨头为例,从2012年到2020年,这家企业花了8年时间,耗资几十亿元,把20万人和20余个分散在全球的生产基地、事业部的业务流程、数据统一。这个巨大的工程是在核心管理层的大力推动下进行的,但项目主导者在接受媒体采访时将数字化改造视作旧城改造,并表示最害怕别人问的问题是几十亿元投进去的产出是什么,数字化带来的收益很难直观演说。
这些都是生产数字化、产业互联网或工业互联网发展过程中的真问题,在短期它们都很难有明晰的解决方案。它侧面反映了制造企业的工厂智能之路是一个长期的系统性工程,顶层设计成了工厂智能之路必须要重视的点。
荣亮认为,企业在建设智能工厂和产线之初应该从全局和企业的战略目标角度来规划方案,之后才能基于目标和投入来敲定具体的策略和实施路径。当下,他接触到了大量来自沿海省份制造企业的需求,这些企业正出于环保、人力成本上涨等各种原因将生产基地向中西部省份迁移。这些企业在建设之初就将产线的信息化、智能化手段纳入了考量中。荣亮核算过成本,相比对旧厂房和生产基地的改造,从零开始建一座智能工厂可能是更合算的选择。
这种动向传递出的信息是,国内正在发生的产业转移可能在以我们预想以外的方式展开。此前许多观察者们设想,中国的产业从沿海向中西部省份的迁移逻辑是追求更低的劳动力资源和更低的土地价格,转移的企业也会以相对落后的产能为主。
但现实的情况是,这些迁移到中西部省份的生产基地里不乏一开始便以智能化工厂为目标建设的新型工厂。它的智能化水平和基础设施水平并不输给沿海的企业,产业并非严格按照梯级的形式从东南沿海向内陆延伸。
学者卡萝塔·佩蕾丝研究认为,技术革命是后发国家在产业上追赶先进国难得的机会窗口,通过利用新技术,后发国家有可能形成新的优势,从而实现赶超和跨越式发展。从当下的智能工厂建设动向里,这个理论也许有应用到我国地域产业竞争层面的可能性。
对每一家正在进行数字化转型的企业而言,工厂里的智能之路都是一场摸着石头过河的实验。这也是一张没有标准答案的问卷。不同行业、不同规模、不同制造模式的企业,推进智能工厂的方式千差万别,“道阻且长”。企业要在深水区里艰难跋涉,要做出短期可能看不到成效却又不得不进行的尝试。
而技术和解决方案提供方也在步入无人区,他们必须直面和解决各种各样的新问题,才能应对发展中的市场。