本文由 【AI 前线】原创,原文链接: t.cn/RHoI2Rc
作者|朱武
编辑|Emily
AI 前线导读:" 相比如火如荼的消费级人工智能,AI 技术在工业和制造业的发展与落地却显得不温不火。工业智能虽隶属于弱人工智能,但在某种程度上,其高度的「自治性」与「独立性」应被施以更多关注。例如,工业机器人通常被设计用来执行特定的细分任务,而现代机器人则被授予了新的使命:做出实时决策。
在采访今天的主角——天泽智云首席架构师朱武 前,工业智能、虚拟智能体、工业互联网等概念彷佛如盘根错节般难以被释清,这同时也反映了工业智能背后的技术发展成为我们关注的空白区之一。于是,带着对工业场景的机理、工业智能背后的数据提取、建模、训练等技术挑战、智能决策系统技术架构的疑问,我们开启了这次好奇心之旅。"
开篇:为工业智能正义还记得在《机器之心》中,作者雷 • 库兹韦尔阐述了一幕大胆的预测:未来的世界,人类和机器将难分彼此,人类将不再是万物之灵。
如果将人工智能应用看作最终呈现的产品,那么决定 "产品质量" 各项要素的五个方面则形成工业智能的五要素模型——"人机料法环"。在旧有理解中,人作为活动第一驱动力而存在,与其他四要素并不同属一个范畴内。但在工业智能实施的情况下,生产组织方式发生了变化:
朱武解释说:"在这个模型中,活动作为一个虚拟的智能体,人在活动中的重要性弱化,活动的第一驱动力来自于反应活动的数据(知识)。这是智能在工业上应用所带来的最大变化和意义所在。" 虽然从目前技术发展角度来说,绝大多数工业场景应用还达不到这种完全虚拟、完全智能的程度,但朱武强调,生产组织方式变化对应着智能应用方向的革新,从而直接影响了分析、创建系统的方法和流程。
而说到这里,我们并非想强调假大空的概念。定义工业场景的机理对于构建活动虚拟智能实体具有非常重要的基础作用。
可以看到,国内目前并不乏为工业领域提供 AI 解决方案的企业,林林总总包含了大数据公司、云计算厂商等同胞,但可能多半并不能清晰地定义工业场景的问题域,或很难从特定知识和数据维度进行工业场景分析。
比如用户需要对生产线进行优化,那就需要对具体产线进行分析,影响产线的主要是设备问题、工艺问题、还是人员问题?这是界定问题域的过程;再比如确定了问题是预测齿轮箱的故障,那就需要知道齿轮箱的构造、运转方式及工况,故障模式和相应的故障现象,这是为分析问题所涉及的实体对象的领域知识。
总结来说,工业场景的机理定义需要依赖于合理层次和颗粒度的问题定义,获得相关性的数据集,最终形成问题到数据集再到特征的映射。但同时,目前的工业智能还处在初级阶段,大部分场景下还做不到完全智能化,但只要具备活动优化、自适应等特点的系统,都可以属于工业智能应用的范畴。
黄沙百战穿金甲——工业智能实现背后的技术挑战问题域的确定和分析方法等众多环节的联结,会导致工业智能实现上所面临的技术挑战或远高于消费级人工智能所对应的难题。
例如,在 2015 年通用电气(General Electric)推出 GE Digital 时,GE Digital 的 CTO Harel Kodesh 就提出过:工业数据不准确、工业智能对风险控制和响应能力的高要求、终端处理能力的限制、复杂模型必须被解释等显示了工业智能与消费人工智能的重要区别,这也导致了在数据、算法和模型训练上工业智能所要开辟的一些「新领域」。
在采访中,朱武为我们解释了数据特征提取、建模等层面的技术挑战:
工业数据的多源性、复杂性和动态性强,比如柴油机气缸排气温度,取决于燃油、燃烧、进气温度、封闭性等等,因此,特征提取要求在高背景噪声下必须实现准确且快速的降维。另外,在数据建模及训练层面,工业应用的碎片化、个性化以及结果的专业性,需要建模及训练在整体和个体、通用性和个性化之间取得均衡。
那么,实现人工智能所依赖的关键技术多如牛毛,数据感知、大数据、机器学习、自动控制、仿真等该怎样地更好应用在工业智能中呢?朱武认为,从工程实现的角度,工业智能实现的关键有如下几步:
美国早在 2006 年提出了 Cyber-Physical System(CPS), 也就是 "信息 - 物理系统" 的概念,并将此项技术体系作为新一代技术革命的突破点。
依照美国 NSF 智能维护系统中心创始主任李杰教授、天泽智云 CTO 刘宗长共同发表的《工业大数据:挖掘 "不可见世界" 中的价值》一文中的阐述,CPS 是一个具有清晰架构和使用流程的技术体系,针对工业大数据的特点和分析要求所构拟的技术体系,其能够实现对数据进行收集、汇总、解析、排序、分析等全套处理流程,实现对工业数据进行流水线式的实时分析能力,并在分析过程中充分考虑机理逻辑、流程关系、活动目标、商业活动等特征和要求。因此可作为工业大数据分析中的智能化体系的核心。
CPS 的 5C 架构
于是,智能决策系统孕育了在朱武看来,虽然 CPS 带有仿真环境的属性,但其很大程度上具备了智能性,"在工业场景下,很多细节需要机器或系统具备自动学习与调整的能力"。此外,CPS 内含协作概念,是实体虚拟空间的映射,并且使得实体设备与虚拟设备之间形成关联性和相互影响——朱武称之为自协作。
而工业智能机理的特定性、工业智能应用实施速度的提升(避免算法选型、数据诊断处理的大量耗时)以及标准化其实施和方法的需求,使得智能决策系统的研发和上线成为必要,天泽智云工业智能决策系统的诞生也是基于这样的背景:
目前,CPS 的 5C(智能感知层、信息挖掘层、网络层、认知层和配置执行层)在智能决策系统中有这些对应实现:
但同时,朱武也坦言,受制于现阶段国内工业智能发展的局限性及各场景间的零碎性,再加上 CPS 体系的复杂性,目前的智能决策系统都不能称之为 CPS 的全部实现。
智能决策系统如何用技术实现智能决策?由于受工业环境不同种使用场景的约束,天泽智云会根据部署环境和业务场景的不同采用差异化的技术实施手段,因而,智能决策系统的技术架构也需要根据特定情境来调整。下图是天泽智云智能决策系统顶层功能架构图的全貌:
天泽智云智能决策系统功能架构
从功能架构图中可以看到,智能决策系统分成了数据分析与设计、计算环境、CPS 协作集成引擎、服务环境、数据接入、数据持久化及业务应用 APP 等多个模块。
朱武补充道,抛开功能架构不谈,智能决策系统的技术架构设计需重点考量三点:
整个结构分为对外的基于功能切面的服务与内部基于虚拟实体资源组织实现。在外部请求时,首先通过 API 网关,基于服务注册与发现,查询与定位服务,当风功率预测服务未启动时,服务注册与发现通知服务调度,服务调度创建并启动风功率预测服务。风功率预测将具体功能,如风场总输出功率预测、单风机输出功率预测等,请求各自的虚拟实体资源。虚拟实体资源,可以视为具备对外提供数据能力的虚拟化设备,该虚拟设备从逻辑上组织相应的数据接入、基于数据持久化的数据集、相应的计算任务,同时,可按照用户定义的策略,结合数据接入的实时状态数据,自动执行、管理其行为。
智能决策系统中的高并发和高可用问题工业场景中,数据质量、数据全面性和数据精准性问题是很多企业的「烫手山芋」,"利用数据建模的手段解决某一问题时,需要获取与被分析对象相关的全面参数",这也使得智能决策系统的计算环境一环需要面临高并发和高可用的挑战。
当然,需要澄清的一点是,这里指的高并发和高可用与传统意义上的意思有所区分。按照朱武的解释,工业智能的运行场景一旦场景明确化之后,并发量的大小是可以提前预知且明确的,所以高并发的严格指代是——考虑在不同业务场景下不同的负载该如何设置,如何优化调度策略和服务组织,使得单个应用实例跑的更好,从而解决资源的高效利用。同样,高可用通常指通过设计减少系统不能提供服务的时间。但工业智能计算环境中由于算法装载等问题,导致无法全然断定服务出错的时间,或实现对服务有效性的精准判断。
工业场景,解决高并发问题实质是提升效率,而提高效率的关键点之一即实现数据的内聚性。智能决策系统除了常见的设计策略外,根据工业场景的特点,朱武团队采用了数据区块化的设计方式:
工业智能应用一般是按照实体对象去采集、存储和访问数据,因此数据具备局部化特性。
朱武解释说,对于采集数据,通常情况下是在用分布式缓存 Redis 前用哈希映射到某一数据节点,并且最好使可执行节点和数据在同一个本机上,实现同样的机制映射,同时再设置相对合适时间阈值,这样就可以做到更好的分配。
另外,还可通过资源抽象的方式解决高可用问题,即让运行资源和运行实体分离来,动态按照需求调配运行资源。
该环节实际上可理解为计算节点重复利用问题,尽量让计算节点按照实际需求而分布。例如,请求接入后可从资源管理中获得资源空闲结果,采用调度策略找到相对应的节点,从而直接与计算节点建立关联。执行过程中,还可通过服务监控和灵活调度及时发现问题。
因此,在智能决策系统中,计算环境作为提供算法、模型的管理、运行和调度平台,(从业务场景来看)需要具备如下特性:
数据接入实现了现场数据、系统边界外数据接入系统的能力,根据工业数据应用的特点,数据接入需要具备如下特性:
此外,数据接入还面临到不稳定状态下的数据可靠传输、数据预处理(包括质量过滤)、实体信息和背景信息融合等多维度的技术挑战。
以智能风场的能量管理系统为例,其需要的数据接入如下图:
从上图可以看出,其数据来源、数据链路、数据通信协议及时效性、安全性约束的多样性。目前,天泽智云是软硬结合来解决和完成数据接入的问题。通过边缘计算、工业物联网网关、PLC/SCADA 这些硬件设施解决部分接入,在软件层面通过通信代理、总线技术解决另一部分数据接入。总的来说,还是亟需行业和政策的共同推动,从根源上统一技术栈,实现智能接入的真正落地。
如何将人才真正「适配」到工业智能中在采访过程中,朱武与我们多次谈到了工业场景机理的特殊性和差异性,二者决定着工业智能的推动不仅需要从业人才具备数据、算法等技术技能,同时还要面对着各种工业领域新知识的「侵袭」。这就对挑选合适人才、使新晋成员更快获得成长等方面提出了更多挑战。
朱武重点阐述了他们的三点培养方法:
一是给予成员清晰的定位,规划、设定其所处的技术维度,在技术上为其划分精确的方向和专业,与其共同谋划好职业成长路线;朱武团队内部目前没有采用一带一的传统成长计划,而是通常分三人小组,分配任务时以团队为单位进行,从而促进其小组内部的技术交流氛围,让每个人获得更快的成长速度。
二是强调技术分享和轮岗制。朱武团队很鼓励在某一个技术领域有了一定积淀后,为获得更充分的应用和解决方法而参与到另一个技术领域的构建中,从而实现技术上的自由转换。
三是充分信任,做到合理的任务分配。工业智能没有更多的捷径和投机取巧的方式实现落地,无论在技术层的突围还是人才层的吸纳,脚踏实地是关键。这也是采访中朱武不断强调懂工业机理重要性的原因。
采访嘉宾介绍朱武,天泽智云首席架构师,承担过多项国家重点型号科研项目,擅长工业领域的软件系统开发、测试和架构设计。曾就职于中国船舶系统工程研究院,主导并实施海军后勤装备保障体系信息化建设;作为总架构师与 IMS 共同合作,参与船舶智能运行与维护(SOMS)系统等多个智能化系统的架构设计和实施。
关注后回复「AI」你懂的
来源: https://juejin.im/post/5a477fe36fb9a0450e767380