当前位置：

首页
/
IT
/
程序
/
海阔凭鱼跃：记一场工业场景下的 AI 技术实践

海阔凭鱼跃：记一场工业场景下的 AI 技术实践

本文由【AI 前线】原创，原文链接： t.cn/RHoI2Rc

作者｜朱武

编辑｜Emily

AI 前线导读：" 相比如火如荼的消费级人工智能，AI 技术在工业和制造业的发展与落地却显得不温不火。工业智能虽隶属于弱人工智能，但在某种程度上，其高度的「自治性」与「独立性」应被施以更多关注。例如，工业机器人通常被设计用来执行特定的细分任务，而现代机器人则被授予了新的使命：做出实时决策。

在采访今天的主角——天泽智云首席架构师朱武前，工业智能、虚拟智能体、工业互联网等概念彷佛如盘根错节般难以被释清，这同时也反映了工业智能背后的技术发展成为我们关注的空白区之一。于是，带着对工业场景的机理、工业智能背后的数据提取、建模、训练等技术挑战、智能决策系统技术架构的疑问，我们开启了这次好奇心之旅。"

开篇：为工业智能正义

还记得在《机器之心》中，作者雷 • 库兹韦尔阐述了一幕大胆的预测：未来的世界，人类和机器将难分彼此，人类将不再是万物之灵。

如果将人工智能应用看作最终呈现的产品，那么决定 "产品质量" 各项要素的五个方面则形成工业智能的五要素模型——"人机料法环"。在旧有理解中，人作为活动第一驱动力而存在，与其他四要素并不同属一个范畴内。但在工业智能实施的情况下，生产组织方式发生了变化：

朱武解释说："在这个模型中，活动作为一个虚拟的智能体，人在活动中的重要性弱化，活动的第一驱动力来自于反应活动的数据（知识）。这是智能在工业上应用所带来的最大变化和意义所在。" 虽然从目前技术发展角度来说，绝大多数工业场景应用还达不到这种完全虚拟、完全智能的程度，但朱武强调，生产组织方式变化对应着智能应用方向的革新，从而直接影响了分析、创建系统的方法和流程。

而说到这里，我们并非想强调假大空的概念。定义工业场景的机理对于构建活动虚拟智能实体具有非常重要的基础作用。

可以看到，国内目前并不乏为工业领域提供 AI 解决方案的企业，林林总总包含了大数据公司、云计算厂商等同胞，但可能多半并不能清晰地定义工业场景的问题域，或很难从特定知识和数据维度进行工业场景分析。

比如用户需要对生产线进行优化，那就需要对具体产线进行分析，影响产线的主要是设备问题、工艺问题、还是人员问题？这是界定问题域的过程；再比如确定了问题是预测齿轮箱的故障，那就需要知道齿轮箱的构造、运转方式及工况，故障模式和相应的故障现象，这是为分析问题所涉及的实体对象的领域知识。

总结来说，工业场景的机理定义需要依赖于合理层次和颗粒度的问题定义，获得相关性的数据集，最终形成问题到数据集再到特征的映射。

但同时，目前的工业智能还处在初级阶段，大部分场景下还做不到完全智能化，但只要具备活动优化、自适应等特点的系统，都可以属于工业智能应用的范畴。

黄沙百战穿金甲——工业智能实现背后的技术挑战

问题域的确定和分析方法等众多环节的联结，会导致工业智能实现上所面临的技术挑战或远高于消费级人工智能所对应的难题。

例如，在 2015 年通用电气（General Electric）推出 GE Digital 时，GE Digital 的 CTO Harel Kodesh 就提出过：工业数据不准确、工业智能对风险控制和响应能力的高要求、终端处理能力的限制、复杂模型必须被解释等显示了工业智能与消费人工智能的重要区别，这也导致了在数据、算法和模型训练上工业智能所要开辟的一些「新领域」。

在采访中，朱武为我们解释了数据特征提取、建模等层面的技术挑战：

工业数据的多源性、复杂性和动态性强，比如柴油机气缸排气温度，取决于燃油、燃烧、进气温度、封闭性等等，因此，特征提取要求在高背景噪声下必须实现准确且快速的降维。另外，在数据建模及训练层面，工业应用的碎片化、个性化以及结果的专业性，需要建模及训练在整体和个体、通用性和个性化之间取得均衡。

那么，实现人工智能所依赖的关键技术多如牛毛，数据感知、大数据、机器学习、自动控制、仿真等该怎样地更好应用在工业智能中呢？朱武认为，从工程实现的角度，工业智能实现的关键有如下几步：

定义工业场景：正如上文所提及，问题域所涉及工业场景定义的准确性和完备性决定了该问题在多大程度上被解决的可能性；
数据的完备性和质量：工业现场数据一般带有很多噪声，而数据范围和质量决定了后续处理的难易程度和最终结果的准确性；
智能应用支撑环境：工业智能应用本身就具备碎片化、个性化、专业化的特点，如何提供快速有效的应用实施环境，包括数据环境、模型研发实验环境、应用部署环境等，决定了工业智能应用的推广和客户接受速度。

美国早在 2006 年提出了 Cyber-Physical System（CPS）, 也就是 "信息 - 物理系统" 的概念，并将此项技术体系作为新一代技术革命的突破点。

依照美国 NSF 智能维护系统中心创始主任李杰教授、天泽智云 CTO 刘宗长共同发表的《工业大数据：挖掘 "不可见世界" 中的价值》一文中的阐述，CPS 是一个具有清晰架构和使用流程的技术体系，针对工业大数据的特点和分析要求所构拟的技术体系，其能够实现对数据进行收集、汇总、解析、排序、分析等全套处理流程，实现对工业数据进行流水线式的实时分析能力，并在分析过程中充分考虑机理逻辑、流程关系、活动目标、商业活动等特征和要求。因此可作为工业大数据分析中的智能化体系的核心。

CPS 的 5C 架构

于是，智能决策系统孕育了

在朱武看来，虽然 CPS 带有仿真环境的属性，但其很大程度上具备了智能性，"在工业场景下，很多细节需要机器或系统具备自动学习与调整的能力"。此外，CPS 内含协作概念，是实体虚拟空间的映射，并且使得实体设备与虚拟设备之间形成关联性和相互影响——朱武称之为自协作。

而工业智能机理的特定性、工业智能应用实施速度的提升（避免算法选型、数据诊断处理的大量耗时）以及标准化其实施和方法的需求，使得智能决策系统的研发和上线成为必要，天泽智云工业智能决策系统的诞生也是基于这样的背景：

为将工业领域知识模板化：朱武强调，工业智能的决策分析比较依赖于工业相关的领域知识、计算机科学和智能建模技术，但同时具备这三个方向知识的人员较少，于是将工业领域知识模板化将成为必然，从而降低实施工业智能的难度；
缩短工业智能应用研发和部署的周期：工业智能应用讲究快速反应的能力，实施速度的提升，如果在一套系统中像算法、软件实施、系统实施这类的技术层可以公用，那么可以大大缩减开发时长。
因而天泽智云就让智能决策系统提供数据接入、数据存储、模型发布和应用发布的功能支持，基本分离计算机科学和数据科学，从而数据科学家可以专注模型开发；
支持构建标准化的解决方案：朱武分析说，目前对于不同行业有定制化需求的不同企业，由于数据环境、数据质量及业务应用的复杂程度不同，从定义模型到应用的部署实施是需要 2-3 个月的周期，遇到新的应用场景则会耗费 3-4 个月。工业场景的不确定性太多，因而在智能决策系统中设定支持相关方法如特征提取、数据处理、场景定义等实施显得十分必要，一个标准化的实施方法和解决方案可以推动整个行业的发展，从而摆脱工业智能初级阶段「独乐乐」的窘境。

目前，CPS 的 5C（智能感知层、信息挖掘层、网络层、认知层和配置执行层）在智能决策系统中有这些对应实现：

对于智能感知层：智能决策系统通过边缘计算端点支持现场数据的接入；
对于信息挖掘层：支持任务化的数据迁移，支持各种数据源的动态接入和挂载；
对于网络层：提供基于实体语义的数据访问；
对于认知层：支持算法和模型的测试、试运行和发布；
对于配置层：支持各种业务服务的集成。

但同时，朱武也坦言，受制于现阶段国内工业智能发展的局限性及各场景间的零碎性，再加上 CPS 体系的复杂性，目前的智能决策系统都不能称之为 CPS 的全部实现。

智能决策系统如何用技术实现智能决策？

由于受工业环境不同种使用场景的约束，天泽智云会根据部署环境和业务场景的不同采用差异化的技术实施手段，因而，智能决策系统的技术架构也需要根据特定情境来调整。下图是天泽智云智能决策系统顶层功能架构图的全貌：

天泽智云智能决策系统功能架构

从功能架构图中可以看到，智能决策系统分成了数据分析与设计、计算环境、CPS 协作集成引擎、服务环境、数据接入、数据持久化及业务应用 APP 等多个模块。

朱武补充道，抛开功能架构不谈，智能决策系统的技术架构设计需重点考量三点：

关注技术的可替代性。因为新技术的不断迭代、专为工业场景定制的 IT 通用解决方案的缺失以及各家使用技术栈的不同，决定了架构设计上不应做到高技术耦合性。
实现 CPS 概念的映射。从数据组织、服务组织层面上看，朱武认为应使整体的决策系统体现出动态协同或自组织概念。
将计算环境与服务拆开。朱武解释，拆开的原因是想体现两种不同性质服务的概念。一般的服务环境并发性是横向扩展的，但计算环境中的服务执行在扩展性和并发性上体现的策略不同，另外再加上算法间的强依赖性，因而导致必须将计算环境与服务环境区隔开来。以实现风场风功率预测功能为例，其实现如下图所示：

整个结构分为对外的基于功能切面的服务与内部基于虚拟实体资源组织实现。在外部请求时，首先通过 API 网关，基于服务注册与发现，查询与定位服务，当风功率预测服务未启动时，服务注册与发现通知服务调度，服务调度创建并启动风功率预测服务。风功率预测将具体功能，如风场总输出功率预测、单风机输出功率预测等，请求各自的虚拟实体资源。虚拟实体资源，可以视为具备对外提供数据能力的虚拟化设备，该虚拟设备从逻辑上组织相应的数据接入、基于数据持久化的数据集、相应的计算任务，同时，可按照用户定义的策略，结合数据接入的实时状态数据，自动执行、管理其行为。

智能决策系统中的高并发和高可用问题

工业场景中，数据质量、数据全面性和数据精准性问题是很多企业的「烫手山芋」，"利用数据建模的手段解决某一问题时，需要获取与被分析对象相关的全面参数"，这也使得智能决策系统的计算环境一环需要面临高并发和高可用的挑战。

当然，需要澄清的一点是，这里指的高并发和高可用与传统意义上的意思有所区分。按照朱武的解释，工业智能的运行场景一旦场景明确化之后，并发量的大小是可以提前预知且明确的，所以高并发的严格指代是——考虑在不同业务场景下不同的负载该如何设置，如何优化调度策略和服务组织，使得单个应用实例跑的更好，从而解决资源的高效利用。同样，高可用通常指通过设计减少系统不能提供服务的时间。但工业智能计算环境中由于算法装载等问题，导致无法全然断定服务出错的时间，或实现对服务有效性的精准判断。

工业场景，解决高并发问题实质是提升效率，而提高效率的关键点之一即实现数据的内聚性。智能决策系统除了常见的设计策略外，根据工业场景的特点，朱武团队采用了数据区块化的设计方式：

工业智能应用一般是按照实体对象去采集、存储和访问数据，因此数据具备局部化特性。

朱武解释说，对于采集数据，通常情况下是在用分布式缓存 Redis 前用哈希映射到某一数据节点，并且最好使可执行节点和数据在同一个本机上，实现同样的机制映射，同时再设置相对合适时间阈值，这样就可以做到更好的分配。

另外，还可通过资源抽象的方式解决高可用问题，即让运行资源和运行实体分离来，动态按照需求调配运行资源。

该环节实际上可理解为计算节点重复利用问题，尽量让计算节点按照实际需求而分布。例如，请求接入后可从资源管理中获得资源空闲结果，采用调度策略找到相对应的节点，从而直接与计算节点建立关联。执行过程中，还可通过服务监控和灵活调度及时发现问题。

因此，在智能决策系统中，计算环境作为提供算法、模型的管理、运行和调度平台，（从业务场景来看）需要具备如下特性：

算法、模型依赖于不同的运行环境和组件包，集成时的形式存在多种形式，因此 计算环境需具备不同编程语言与框架的算法、模型集成能力；
计算环境应采用特定的算法、模型状态管理机制，用于服务治理。 对一部分算法、模型的执行，不太适用时间阈值的方式；
算法、模型执行效率，涉及算法、模型间的数据共享和协作，以及算法、模型内部中间结果的传递策略；
计算环境需要部署在不同的运行环境中，要求 计算环境能够根据实际需求伸缩和选择性部署的能力。

数据接入实现了现场数据、系统边界外数据接入系统的能力，根据工业数据应用的特点，数据接入需要具备如下特性：

多种协议集成和采集策略的实施：IoT 在接入数据层会有各种各样的协议，因此需要将不同的协议进行集成。另外就是采集策略也是千变万化，但要想推进标准化和品牌化就会使得很多采集策略失效，因而目前的解决方案也只能靠人工解决。
多种时效性数据的双向传输： 在天泽智云目前的业务场景中，有上传和下传两种时效性传输。上传涉及到状态数据、振动产生的文件或数据集等，下传数据包括指令数据和更新。
错峰控制： 在上传和下传实时数据时，可能会遇到数据积累和堵塞情况。底层传输机制的实现在部分 IoT 组件上并未最大程度上优化实时性。因此，业界有用到组态软件来解决该类问题的方案。但组态本身来讲是组织态势，组态软件是指可配置、可调整的软件系统，并不指实时性。所以数据接入的时候，很容易会面临 物理上同一个链路的竞争，所以需要适当控制。

此外，数据接入还面临到不稳定状态下的数据可靠传输、数据预处理（包括质量过滤）、实体信息和背景信息融合等多维度的技术挑战。

以智能风场的能量管理系统为例，其需要的数据接入如下图：

从上图可以看出，其数据来源、数据链路、数据通信协议及时效性、安全性约束的多样性。目前，天泽智云是软硬结合来解决和完成数据接入的问题。通过边缘计算、工业物联网网关、PLC/SCADA 这些硬件设施解决部分接入，在软件层面通过通信代理、总线技术解决另一部分数据接入。总的来说，还是亟需行业和政策的共同推动，从根源上统一技术栈，实现智能接入的真正落地。

如何将人才真正「适配」到工业智能中

在采访过程中，朱武与我们多次谈到了工业场景机理的特殊性和差异性，二者决定着工业智能的推动不仅需要从业人才具备数据、算法等技术技能，同时还要面对着各种工业领域新知识的「侵袭」。这就对挑选合适人才、使新晋成员更快获得成长等方面提出了更多挑战。

朱武重点阐述了他们的三点培养方法：

一是给予成员清晰的定位，规划、设定其所处的技术维度，在技术上为其划分精确的方向和专业，与其共同谋划好职业成长路线；朱武团队内部目前没有采用一带一的传统成长计划，而是通常分三人小组，分配任务时以团队为单位进行，从而促进其小组内部的技术交流氛围，让每个人获得更快的成长速度。

二是强调技术分享和轮岗制。朱武团队很鼓励在某一个技术领域有了一定积淀后，为获得更充分的应用和解决方法而参与到另一个技术领域的构建中，从而实现技术上的自由转换。

三是充分信任，做到合理的任务分配。工业智能没有更多的捷径和投机取巧的方式实现落地，无论在技术层的突围还是人才层的吸纳，脚踏实地是关键。这也是采访中朱武不断强调懂工业机理重要性的原因。

采访嘉宾介绍

朱武，天泽智云首席架构师，承担过多项国家重点型号科研项目，擅长工业领域的软件系统开发、测试和架构设计。曾就职于中国船舶系统工程研究院，主导并实施海军后勤装备保障体系信息化建设；作为总架构师与 IMS 共同合作，参与船舶智能运行与维护（SOMS）系统等多个智能化系统的架构设计和实施。

关注后回复「AI」你懂的

来源: https://juejin.im/post/5a477fe36fb9a0450e767380

与本文相关文章

暂无,快来抢沙发吧！