近日, 未来今日研究所发布了最新版《2019 年科技趋势报告》, 其中包括对人工智能在内的 315 项科技未来一年的发展前景进行了展望. 这份报告对 AI 领域的技术预测可谓面面俱到, 无论是对于 AI 企业, 研究者, 还是 AI 学习者, 这都是一份比较详尽的报告. 但限于篇幅, AI 前线只精选了其中关于 AI 的部分进行翻译, 希望对读者有参考价值.
2019 年关键词
首先, 上图所示是在这份报告中出现频率较高的一些关键词, 包括数据, 地图, 监管, 中国, 管控, 竞争, 架构, 合作, 自动化, 识别等.
AI 技术趋势总览
AI: 第三个计算时代
在 20 世纪 50 年代, 一个能够进行长除法的计算器, 在现在看来很难说是 AI 中的一项先进技术. 这就是这一领域中的 "奇怪悖论" -- 新技术出现后并入主流, 它们对我们来说就变得不可见了.
人工智能本身并不是一种趋势, 而是当代最重要的技术发展. 它不是一种技术趋势, 而是继制表时代, 编程时代之后的第三个计算时代, 它连接着我们生活, 商业, 管理的方方面面.
AI 九巨头: 六家美国公司 vs 三家中国公司
2019 年, 九家大型科技公司将主导 AI 领域, 包括六家美国公司, 三家中国公司, 它们将对人工智能的未来负有最大的责任, 分别是美国的 G-MAFIA-- 谷歌, 亚马逊, 微软, 苹果, IBM 和 Facebook. 在中国, 它们是 BAT-- 百度, 阿里巴巴和腾讯.
这九家公司主要负责绝大部分 AI 研究, 资金, 政府参与和消费级应用. 大学的研究人员和实验室将依赖这些公司提供的数据, 工具和资金. 九大巨头也负责合并和收购, 资助 AI 初创公司, 并支持下一代开发人员.
美国政府还没有人工智能方面的大战略, 也没有长期规划, 而是将 AI 的基础研究有效地外包给商业部门和华尔街. 与此同时, 在中国, 人工智能的发展轨道和政府拴在了一起. 百度, 腾讯和阿里巴巴以及所有涉及 AI 的公司, 发展都要受到政府的限制. 中国正在迅速奠定成为 AI 霸主的基础.
不要过分乐观或恐惧
当谈到 AI 时, 我们总是过于乐观或恐惧, AI 将导致失业, 杀死人类的论调不绝于耳. 但是, 随着时间的流逝, 我们越来越忽视 AI 取得的重大突破和进步, 数据的获取和探索的过程变得越来越模糊, 自动化决策系统的决策机制越来越不透明. 这就种下了不信任和误解的种子.
在消费级人脸产品和应用中的 AI 趋势
001 消费级 AI 应用程序
现在, 专业研究人员使用的高技术 AI 应用程序已经在转向更轻巧, 用户友好的应用程序. 新的自动化机器学习平台, 如 DataRobot, 使得非专家也可以构建和部署预测模型. 在不久的将来, 我们很可能可以在日常生活和工作中使用各种 AI 应用程序, 就像我们今天使用 Microsoft Office 或 Google Docs 一样.
002 无处不在的数字助理
数字助理(DAS), 如 Siri,Alexa, 以及它们的中国 "同行" 天猫, 利用语义和自然语言处理和数据预测我们想要什么, 或者下一步需要做什么. 现在, 已经有成千上万的应用程序和小工具可以跟踪和响应 DA. 举一个例子, 亚马逊的 Alexa 在 2018 年推出了 4000 个小工具, 现在有超过 28000 个设备与亚马逊的 DA 集成. 随着设备价格的下降(如价格低于 20 美元的入门级扬声器), 系统与我们互动的能力越来越强, 可以预测, 在 2019 年 DA 将无处不在.
003 环境接口将发挥更大的作用
它也被称为 "零 UI", 我们的现代接口其实越来越像氛围音乐, 能够在少量指导的前提下为我们做更多的事, 且能够吸引我们的注意力. 我们将不再依靠单个输入屏幕, 或者很多屏幕, 而是更加无障碍地与计算机进行交互.
在信息时代, 普通成年人每天要做出超过 20000 个大大小小的决定, 而新型数字助理将代替我们优化决策分配任务, 甚至根据环境自动回复. 这些决定很有可能不需要你的直接监督或输入. 氛围设计变得如此具有吸引力, 是因为在不远的未来它能够减少我们所做的决定. 我们可以将之视为一种意愿自动完成机制. 我们将主动和被动地与可用设备, 恒温器, 汽车或口袋中的 DA 进行互动, 他们会在后台听取和观察, 有时甚至会提问, 有时还会根据需要为我们提供文本, 音频或触觉通知, 所有这些将由算法决定. 梅特卡夫定律 (Metcalfe's law: 一个网络的价值等于该网络内的节点数的平方, 而且该网络的价值与联网的用户数的平方成正比) 解释了环境接口的定义.
随着越来越多的人成为环境信息网络的一部分, 我们将来会看到更多的环境接口用例.
004 深层链接无处不在
深度移动链接自智能手机出现起就已存在, 它使我们可以更轻松地在所有手机应用中查找和共享数据. 有三种深层次的联系: 传统的, 延迟的和语境的. 传统的深层链接可以从一个应用或网站重定位用户: 比如当你点击某人在 Twitter 上发布的华尔街日报链接, 只要你安装了 WSJ 应用程序, 它就可以在 WSJ 应用程序中自动打开. 如果安装了应用程序, 延迟深层链接可以直接链接到内容, 也可以连接到应用商店以下载应用程序. 上下文深层链接提供更多的信息, 它们可以将你从网站带到 App, 从 App 带到网站, 或从 App 带到 App, 还可以提供个性化信息.
随着机器学习的进步, 针对个人用户习惯量身定制的应用到应用体验可能会变得更加普及.
社会和地缘政治中的 AI 趋势
005 弗兰肯算法的扩散
随着人工智能领域的蓬勃发展, 部署代码的人数也在不断增加. 随着自动化系统变得越来越普遍, 所有代码都会传输到算法中, 其中一些算法会继续生成新的算法, 由此产生的过程和程序可能比最初的预期更复杂. 这可能会导致不可预测性, 使得理解决策过程变得更加困难. 对于像 Facebook 这样数十亿算法同时工作的大公司而言, 这已经是一个挑战.
006 孪生可部署 AI 版本
它也被称为数字双胞胎, 许多初创公司可以构建可部署的 AI 版本, 他们提供可定制, 可训练的平台, 能够学习关于你本人的一切, 作为你在网络上的代表. Molly 是 Y Combinator 支持的一家创业公司, 也是几个新的 AI 代理商之一. 它的功能更像 AMA(有问必答), 在这里, 每个人都可以得到关于你的信息. 遇到不懂的, Molly 会 "请教" 你本人, 学习关于你的知识.
007 AI 中的偏见
人工智能有严重的偏见问题并不是秘密. 这个问题是多方面的, 例如: 用于训练的数据集通常来自维基百科等地, 这本身就充满了偏见. 人们建造模型往往是同质的, 并经常意识不到自己的偏见. 随着我们的计算机系统越来越习惯于做出决策, 我们可能会发现自己被按算法做出毫无意义的分类, 但这可能会产生巨大的影响.
008 AI 偏见导致社会问题
每一天, 我们都在主动 (在 Facebook 上传和标记照片) 或被动地 (在线搜索医疗症状, 开车上班) 创建难以想象的大量数据. 这些数据经常在你未知的情况下被算法挖掘和使用, 用于制作广告, 帮助潜在雇主预测我们的行为, 确定我们的抵押贷款利率, 甚至帮助执法预测我们是否可能犯罪. 包括马里兰大学, 哥伦比亚大学, 卡内基梅隆大学, 麻省理工学院, 普林斯顿大学, 加州大学伯克利分校, 国际计算机科学研究所等多所大学的研究人员正在研究自动化决策的副作用.
009 让 AI 解释自己
毫无疑问, 有人认为人工智能正在成为一个 "黑匣子", 即使在该领域工作的研究人员也不了解最新的系统是如何运作的. 但这并不完全正确, 虽然计算机科学家, 记者和计算机科学家越来越关注这一问题, 认为人工智能系统不应该是个秘密. 展望未来, 我们将讨论 AI 是否应该, 如何能够解释其决策, 以及如何提高透明度. 关于问责制的辩论也会很多. 但解决这个问题面临着一个巨大的挑战, 即透明度将要求公司公开其商业利润的秘诀, 而且要求系统同时解释决策过程会降低输出的速度和质量.
010 问责制和信任
我们很快即将到达一个时刻, 即无论是有意还是无意, 我们都无法判断数据集是否已经被篡改过. AI 系统依赖于我们的信任. 如果我们不再相信结果, 那么几十年的研究和技术进步将是徒劳的. 政府, 企业, 非营利组织等领域的领导者必须对所使用的数据和算法充满信心.
建立信任和问责制是公开工作的一种方法, 这个过程将非常复杂, 因为公司, 政府机关, 执法机构和其他组织希望数据保密.
011 AI 隐藏数据
计算机完全按照命令行事. 只要命令机器在游戏中获胜, 机器将会不惜不惜一切代价完成这个任务. 显然包括作弊.
斯坦福大学和谷歌的研究人员发现, 将卫星图像转换为可用地图的 AI 可能会 "扣留" 某些数据. 这个名为 CycleGAN 的神经网络可以学习如何映射图像变换. 例如, 它可以从一张邻居的旧航拍照片中区分街道, 小巷, 车道, 建筑物和灯柱, 并生成可供 GPS 使用的地图. 最初, 他们使用了网络尚未看到的航拍照片, 由此产生的图像看起来非常接近原始图像.
但经过深入检查, 研究人员发现, 原始图像和生成的图像中都有很多细节, 这些细节在 AI 制作的地图中是看不到的. 事实证明, 系统学会了在以低幅度高频信号的形式产生的图像中隐藏有关图像内部原始图像的信息.
012 未报道 AI 事故增加
2018 年发生了许多与人工智能有关的事故, 但只有少数成为头条新闻, 比如一辆优步无人车在亚利桑那州坦佩致一名行人死亡. 但事实上还有无数次事件没有导致死亡, 因此不为公众所知. 目前, 除非触犯法律, 研究人员没有义务报告涉及我们的数据或 AI 流程的事故或意外. 虽然大公司必须告知消费者他们的个人数据, 如信用卡号码等是否被盗, 但他们并不需要公布算法根据种族或性别产生歧视的情况.
中国的 AI 大爆炸
在过去的几年里, 中国在人工智能领域取得了巨大的飞跃. 中国提出到 2030 年成为 "世界最重要的人工智能创新中心", 作为一个国家, 中国已经朝着这个目标取得了重大进展. 九大巨头中的百度, 阿里巴巴和腾讯, 加上其强大的学术环境, 巩固了中国作为全球人工智能霸主的地位.
BAT
阿里巴巴, 中国版的亚马逊将投资 150 亿美元在未来三年内进行人工智能研究, 在全球七个城市 (包括加利福尼亚州圣马特奥和华盛顿州贝尔维尤) 建立研究中心.
百度 (一家经常与谷歌相比的中国搜索引擎公司) 在硅谷建立了一个人工智能研究中心.
腾讯 (超级流行的消息应用程序微信的开发者) 去年在西雅图开设了一个人工智能实验室, 开始搜罗美国的人才. 此后, 腾讯还增持特斯拉和 Snap 等公司的股份.
中国企业收益不仅仅包括典型的投资回报, 也更加重视知识产权. 总部位于中国的人工智能创业公司目前占全球投资总额的 48%.2018 年 4 月, 商汤估值 45 亿美元, 使其成为当时全球最有价值的人工智能创业公司. 与此同时, 与美国同行相比, 中国研究人员拥有的 AI 相关专利数量是其五倍.
中国的数据盈余
接近 14 亿的庞大人口为研究人员和创业公司提供了未来最有价值的资源 -- 人类数据, 而没有世界其他大部分地区普遍存在的隐私和安全限制. 如果数据是新的石油, 那么中国就是新的石油输出国组织 . 中国人正在挖掘的丰富数据可用于训练人工智能的方方面面, 从教育, 制造到零售和军事应用的各种模式. 例如, 中国创业公司旷视就是开创面纹生成技术的先驱. 面纹生成是一种新型的生物识别身份验证, 它使用我们面部的骨骼结构, 肤色, 甚至毛细血管等特征来进行识别. 这项技术安全性足以用于金融交易 , 并被中国警方广泛用于监控.
带来风险
如果中国开始影响其 "一带一路" 国家将会如何? 想想一下, 如果这些国家强制采用国家社会信用评分系统, 未经居民明确同意开始进行监控, 并且有一个系统在默默打分会发生什么?
企业中的 AI 趋势
013 AI 云
在过去的一年中, AI 生态系统的企业领导者一直在争夺 AI 云共享份额, 成为远程服务器上值得信赖的 AI 提供商.
由于机器学习系统可以访问的数据越多, 旧可以学会做出更好的决策, 因此企业客户可能会坚持使用原始供应商. 因此, AI 云的竞赛开始了. 在西方, 该领域由亚马逊, 谷歌和微软领导, 其次是苹果, IBM,Salesforce,SAP 和甲骨文等公司. 在亚洲市场, AI 云由阿里巴巴和百度主导. 这是一个价值 2500 亿美元的行业, 而且发展迅速.
纽约大学斯特恩商学院教授 Arun Sundararajan 讲得好:"这场竞赛的奖品将是成为下一个科技时代的操作系统."
014 无服务器计算
AWS, 阿里巴巴云, 微软 Azure, 谷歌云和百度云都为开发人员推出了新的产品和套餐, 希望能让更多人工智能创业公司更容易, 成本更低地将他们的想法推向市场. 亚马逊的 AWS Lambda 让团队可以虚拟地运行任何类型的应用程序或后端服务代码, 而无需配置或管理服务器或实际管理. 微软 Azure 功能架构支持无数的编程语言, 可根据需要进行扩展, 仅对主动计算时间收费. 然而, 这并不适合一些工程师, 他们担心会失去控制.
015 人工智能的新型责任
法律往往落后于技术. 然而, 去年在亚利桑那州发生的优步无人车致命事故现在让风险管理人员和法律部门考虑到因人工智能事故而导致意外损失的风险. 我们面临的挑战是当前建立的法律制度是为了规范人类行为, 而不是无人监督机器的行为. 目前, 安联正在研究新的责任保险模型.
016 从短视频中生成虚拟环境
芯片厂商英伟达正在教 AI 构建来自短视频剪辑的逼真 3D 环境. 该方法建立在先前关于生成对抗网络 (GAN) 的研究基础上. 英伟达的系统生成图形取自自动驾驶领域使用的开源数据集
, 使用分割成各种类别 (建筑物, 天空, 车辆等) 的短片, 英伟达训练 GAN 生成这些物体的新的不同版本.
自动生成的虚拟环境未来应用潜力巨大: 物流(仓库, 工厂, 运输中心), 城市训练环境
规划模拟, 以及测试游乐园和购物中心内的客户流动场景等.
017 AI 骗局
在建筑物内部署生物识别 ID 系统之前, 公司可能需要三思而后行. 机器学习新技术已经导致合成指纹和其他能够愚弄监控系统的自动生成生物识别器出现. 密歇根州立大学和纽约大学的研究人员构建了一种可以生成假货的算法, 这提醒了我们 AI 骗局的可怕之处, 想象一下, 恶意系统产生数百万个指纹, 远程就可以开门或解锁别人的电脑.
018 环境监测
麻省理工学院计算机视觉科学家已经发现了如何利用他们所谓的 "意外摄像机", 使用计算机视觉来跟踪数据. 结果, 我们可能很快就会有 X 射线一样的视力, 穿墙透视. 对于从事敏感项目的公司而言, 这可能不是一个好消息.
从事信息安全和风险管理的人员应注意到计算机视觉的这一进步.
019 自有的 AI 语言
随着我们进入第三个计算时代, 最大的公司都开始在竞争市场份额的同时争夺思想共享的高地.
微软, IBM, 百度, 阿里巴巴, 亚马逊和谷歌等公司正在为开发人员发布软件包, 且 AI 应用程序有自己独特的编程语言. 优步发布了自己用 Python 编写的概率编程语言 Pyro. 这一举动标志着人工智能生态系统未来可能碎片化, 与我们的 OS X 与 Android 以及早期的 Mac 与 PC 阵营不同. 企业将发现成本越来越高, 且难以轻易在 AI 框架和语言之间切换.
020 AI 芯片
我们的台式机, 笔记本电脑, 平板电脑和手机中的标准 CPU 确实变得越来越强大, 但它们的设计并不是为了满足机器学习的需求. 当前的 CPU 存在的问题, 是它们没有足够的处理单元来完成下一代计算时代所需的所有连接和计算. 我们在 SoC-"片上系统" 中找到一套新的处理器. 华为, 苹果, Alphabet,IBM, 英伟达, 英特尔和高通都在开发新的系统架构和 SoC, 有些经过了预先训练. 简而言之, 这意味着用于 AI 项目的芯片已准备好, 并且速度更快, 数据更安全. Elon Musk 表示特斯拉的新定制 AI 芯片将于 2019 年发布. 谷歌的 TPU 专为 AI 深度学习而设计, 适配公司采用的 TensorFlow 系统.
虽然向企业营销预先训练的芯片将加速 AI 芯片商业化, 并进一步促进芯片研发, 但是开发人员可能需要在不久的将来在不同的框架之间挣扎, 尤其是当各种设备制造商都决定开始创建自有的协议. 我们希望这些公司的产品最终能够融合, 竞争公司及其 SoC 和语言越少越好.
021 AI 算法市场
受人工智能云和无服务器计算的激励, 九大巨头以及开发者社区都在新兴的算法交易市场推出自己的算法. 亚马逊, IBM, 微软, 谷歌, 百度和阿里巴巴都提供预建和可定制的系统. AWS 拥有自己的市场, 提供计算机视觉, 语音识别和文本的模型和算法, 其基础客户包括英特尔, CloudSight,Optpace 等. GenesisAI 为 AI 产品和服务提供市场. Algorithmia
是一个通用的开放式算法市场, 开发人员可以将他们的成果上传到云端出售. Quantiacs 让开发人员构建算法交易系统, 并为算法和投资机构牵线搭桥. Nuance 是一家医学成像 AI 算法 "商店", 其 AI MarketPlace 允许用户在购买之前试用算法. PrecisionHawk 提供预测性农业算法和模型的市场. Bonseyes 是一个欧洲的 AI 工具交易市场. 2019 年, 预计将出现更多通用的, 云定制的市场.
022 AI 整合度更高
目前只有九家大公司主导人工智能领域: 谷歌, 亚马逊, 微软, IBM,Facebook 和苹果在美国, 以及在中国的大公司百度, 阿里巴巴和腾讯(得到中国政府的大力支持). 在投资方面, 高通, 腾讯, 英特尔投资, 谷歌风险投资, 英伟达, Salesforce, 三星风险投资, 阿里巴巴, 苹果, 百度, 花旗和 In-Q-Tel 正在为 AI 的成长提供大部分资金. 在美国, 人工智能公司的投资在 2018 年前两个季度达到创纪录的 42 亿美元. 中国的商汤完成了另一轮成功的融资, 融资 6.2 亿美元, 估值 45 亿美元. 投资者包括阿里巴巴集团, 富达国际和银湖合伙公司. 与所有技术一样, 只有少数几家公司在 AI 领域占据主导地位, 它们一般会垄断人才和知识产权, 并彼此合作. 谈到人工智能的未来, 我们应该思考一个问题, 整合是否意味着更大的利益, 垄断是否会破坏竞争, 就像电信领域一样.
AI 在处理器, 系统和计算神经科学领域的趋势
023 实时机器学习
机器学习是是一种使用算法来分析大数据集以执行各种任务的系统. 随着时间的推移, 系统会更好地完成任务.
实时机器学习的新研究可以使用连续的交易数据流来实时调整模型. 这标志着数据流动和信息检索的方式发生了巨大的变化. 例如, 即使是在多语言环境中, 实时机器学习也可以自动翻译语音. 它可用于改进分类和预测, 进行更好的个性化健康监测和更准确的风险计算. 消费者可以期待收到零售商的更多定制化推荐. 实时偏好不仅会使用历史数据(客户#1234 只喜欢红色唇膏), 而且会考虑上下文信息(顾客#1234 可能会在接下来的三周内购买红色唇膏).
024 自然语言理解(NLU)
我们被现实世界中的非结构化文本所包围, 它们存在于社交媒体, 博客, 公司网站, 市政厅数字记录等各个角落. NLU 允许研究人员通过提取概念, 映射关系和分析情感量化并学习所有文本. NLU 将辅助从事科学和医学, 法律和政策, 基础设施, 农业, 交通, 教育等领域的研究人员, 使他们能够比以往任何时候都能获得更深入的见解.
2019 年, 自然语言理解将在包括口音和语言识别在内的自然语言理解领域获得进步.
025 机器阅读理解(MRC)
对于 AI 研究人员来说, 机器阅读理解一直是一个重要且具有挑战性的目标. MRC 使系统可以读取, 推断意义, 并在筛选大量数据集时立即得到答案.
一个消费级应用: 当进行搜索查询时, 你会想要系统为你提供一个精确的答案而不仅是一个 URL 列表; 一名航空机械师在飞机发生故障时为尽快解决引擎问题, 计算机可以帮他阅读所有技术文档并提供修复建议, 让飞机尽快起飞. 这是 MRC 的未来, 它将不仅关注关键词, 经过训练的 MRC 还可以迁移到没有标签或标准分类的各个领域.
MRC 是实现通用人工智能的必要步骤, 但在短期内它可能只能做到把技术手册, 历史地图, 医疗记录等内容转变为易于搜索的资料库信息.
026 自然语言生成(NLG)
算法可以使用自然语言生成将结构化数据变成自然语言. NLG 对于零售, 金融和媒体在内的各个领域非常重要. 2019 年, NLG 将成为大多数商业智能和分析平台的标配, 可以执行自动检测, 解析, 可视化和叙述关键数据. Arria NLG,IBM Watson 文本 - 语音, 亚马逊 Polly, 谷歌云文本 - 语音, Narrative Science 和 Automated Insights 都可以利用大数据集构建自然语言, 帮助非数据科学人员更好地了解其组织.
NLG 在专业领域拥有无数的用例, 例如协助律师, 政治家, 医生, 顾问, 金融分析师, 营销人员及其他人将我们的个人信息作为自然语言的数据点.
027 语音, 声音和视频的生成算法
芯片制造商英伟达的研究人员在 2018 年部署了一种新的生成算法, 使用生成对抗网络创建逼真的人脸. 在他们的系统中, 算法还可以调整各种元素, 如年龄和雀斑密度.
加州大学伯克利分校的一个团队开发了一个软件, 可以自动将视频中一个人的动作迁移到另一个视频中的另一个人身上. 很长时间以来, 我们都在训练计算机观看视频并预测物理世界中的相应声音, 目的是了解现实世界中事物之间的交互方式. 然而, 这导致了越来越多的 AI 骗局, 如虚假视频和虚假图像. 未来, 这个问题变得越来越严重, AI 以假乱真将引起更多的麻烦.
028 机器学习中的实时语境
IBM 的 Project Debater 展示了如何在实时学习系统中使用上下文. Project Debater 可以就复杂的主题和人类辩论, 通过消化大量文本, 在给定主题上构建结构语言, 传达清晰的目的并反驳其对手. 未来, Project Debater 将通过提供基于证据的论证, 克服情绪, 偏见或模糊的影响来帮助人们进行推理. Debater 只是此类新兴系统的一个例子, 它能够实时学习并利用真实环境.
029 通用强化学习算法
研究人员正在开发一种可以学习多项任务的单一算法. AlphaGo 背后的团队开发了一种创新的算法: AlphaZero, 不仅可以在围棋中实现超人的表现, 还可以在国际象棋和日本国际象棋等其他游戏中超过人类. 除了游戏规则之外, 这一算法没有经过任何知识训练, 即开发出自己的策略来击败其他玩家.
030 机器图像补全
如果计算机系统可以访问足够多的图像, 就可以修补并填充图片中的空缺. 我们可以利用这项技术生成更完美的图像.
但是, 这项技术下一阶段将用于什么情景, 产生什么影响? 我们如何划分现实与增强之间的界限? 图像补全还是执法和军事情报人员的有力工具, 计算机可以帮助他们识别取景框中的对象. 鉴于机器学习算法和数据集的偏见, 图像补全未来可能引起关于隐私的争论.
031 人机混合视觉分析
美国陆军研究实验室的一项新研究显示, 该系统使用一个装有脑机接口的界面, 利用计算机视觉技术让人们在视线范围内快速查看和分类图像. 总部位于洛杉矶的专业图像字幕技术公司 CloudSight 正在研发一套混合众包计算机视觉系统.
032 预测性机器视觉
麻省理工学院 CSAIL 的研究人员训练计算机不仅能识别视频中的内容, 还能预测人类接下来要做什么. 目前, 该计算机系统可以预测视频中的两个人是否可能拥抱, 亲吻, 握手或击掌.
这项研究将在某一天让机器人能够更轻松地探索现实环境, 并从我们的肢体语言中获取线索, 和人类进行互动. 它还可以应用于零售环境, 以及机器操作, 教室学习环境等.
033 更快的深度学习
深度学习系统经过训练可以自主学习. 从概念上讲, 深度学习不是新事物了, 最近只是计算能力和可用的数据量有了变化, 这意味着越来越多的人工流程将实现自动化, 包括自动编写软件等.
深度学习受到计算机网络处理能力的限制, 就在几年前, 在 ImageNet 数据集上训练图像识别模型需要一个月或更长时间, 现在, 凭借更先进的设备, Facebook 可以在一小时内完成同样的工作. 随着计算机变得越来越快和硬件架构的发展, 我们的系统将以远超人类的速度执行任务.
034 强化学习和分层强化学习
强化学习有一个问题: 当代理没有足够的监督, 或其目标是在很长一段时间内运行场景, 对于它们来说是一个很大的挑战. 2019 年及以后, 研究人员将尝试使用分层强化学习解决这些问题 -- 发现高级别的行动并有条不紊地通过学习, 以人类无法想象的速度掌握新任务. 这对于非技术人员来说也很重要: RL 将改善人工智能系统中的 "智能", 帮助汽车学习在异常条件下行驶, 帮助军用无人机执行以前从未在现实世界中尝试的复杂操作.
035 持续学习
目前, 深度学习技术可以帮助人类完成具体的任务, 但完成任务需要严谨的顺序: 收集数据, 确定目标, 部署算法, 这个过程需要人类操作且非常耗时, 尤其是在需要监督训练的早期阶段. 持续学习 (CL) 更多地是关于自主性和增量技能的建立和发展, 研究人员将在 2019 计息推动其发展.
036 多任务学习
看起来毫不相关的任务之间实际上存在着千丝万缕的关系, 有助于达成最终目标. 研究人员会监督系统, 对其进行微调, 直到模型按照预期工作. 但只关注单一任务往往会导致效率低下, 因此, 多任务学习这个新的研究领域将帮助系统探索各种相关任务之间的联系, 以更好地解决问题.
037 生成对抗网络(GANs)
GAN 是指由两个对抗性神经网络组成的无监督深度学习系统, 可以视之为没有人类参与的图灵测试. 经过两个对抗神经网络之间的 "对抗",AI 最终会自动生成现实世界不存在的逼真图像.
GAN 的目标不是耍诡计, 而是为了解决合成数据的问题. GAN 使 AI 系统能够处理尚未清理的原始真实数据, 且无需人工程序员的直接监督.
038 新型生成模型及技术
用于生成建模的自回归分位数网络 (简称 AIQN) 听起来很复杂, 但它是一个创新的想法, 有助于改进算法, 使算法更稳定. 这意味着它可以加快 AI 进步, 为整个生态系统创造更多机遇和创新.
039 胶囊网络
这种新型的神经网络可以利用分层关系处理信息, 解决了一个关键问题: 默认的卷积神经网络无法检测简单和复杂对象之间的某些关键空间层次结构. 因此, 这些新型网络可以将错误率减少 50%.
040 概率编程语言
概率编程语言为开发概率模型减轻了一些压力大且乏味的工作. 这些新型语言允许开发人员构建, 重用和共享他们的模型库, 同时可以容纳不完整的信息.
041 自动机器学习(AutoML)
传统机器学习方法耗时, 麻烦, 尤其对于 AI 领域的数据科学家, 专家和工程师. 自动机器学习是一种新的方法: 将原始数据和模型匹配在一起找到最相关信息. 现在有许多 AutoML 产品和服务
由谷歌, 亚马逊和微软提供.
042 个性化机器学习
很快, 个人用户就可以上传自己的数据来定制现有的模型. 谷歌的 Cloud AutoML 是一套
机器学习工具, 可以让没有经过严格训练的员工定制机器学习模型.
机器人
机器人连续第五年出现在报告中. 当今, 机器人已经成为一个主流词汇, 且不仅只面向消费级群体, 如英国劳埃德银行的员工使用机器人访问该公司的知识库, 谷歌于 2018 年推出智能助手 Duplex 系统, 可以代表用户打电话和预定餐厅.
未来, 机器人的另一大进步将不是关于技术本身, 而是规范. 2018 年, 机器人网络发送虚假信息引起了人们对于机器人造成信任恐慌的担忧, 这导致了加利福尼亚决定立法, 要求机器人在进行交互时表明自己不是人类, 这条法律于 2019 年 7 月 1 日生效, 要求机器人 "清晰, 有意识地, 用合理的设计告知人类与其交互的是一个机器人". 这次立法成功将成为其他州和国家关于机器人立法的新基准, 尤其是当 Duplex 这样的产品大规模流入市场时.
需要关注的公司和项目:
谷歌, 亚马逊, Facebook,Jigsaw, 推特, Instagram,Chatfuel,Pandorabots,
Twilio, 亚马逊, 科大讯飞, Slack, 微信, 腾讯, 百度, 微博, 阿里巴巴, IBM, 微软, Snapchat,Coral Project.
识别技术
这一部分技术趋势包括面纹识别, 声纹识别, 姿势识别, 个性化特征识别, 情感识别, 骨识别, 基因识别, 通用基因数据库, 行为生物识别, Wi-Fi 识别, 环境跟踪, 计算图形, 语音合成, 持续识别, 识别技术偏见.
现在, 先进的计算机系统根据我们独特的特征, 如骨骼结构, 姿势, 情感状态等, 不仅能够识别出我们是谁, 还可以知道我们在想什么.
045 面纹识别
面纹识别技术越来越强大, 中国的旷视科技得到中国和俄罗斯资本的支持, 在面纹识别技术上领先, 安全性足以保障资金交易. 面纹识别与指纹, 虹膜识别不同, 可以在当事人未知的情况下远距离进行采集. 面纹识别系统技术已经比较成熟并得到广泛采用, 如在 2020 年奥运会上, 日本将在登记处采用这种系统.
2019 年, 面纹识别技术将受到法律方面的挑战. 2017 年, 一名联邦法官通过了针对 Shutterfly 提起的集体诉讼, 这家公司涉嫌违反伊利诺伊州生物识别信息隐私法案, 该法案要求公司在收集包括面孔在内的生物识别数据之前需获得书面许可.(伊利诺伊州的这条法律是美国唯一存在的此类法律.)Facebook 目前也正在处理伊利诺伊州居民提出的第 9 起诉讼, 这些居民认为 Facebook 在平台照片标签功能中识别他们的脸部违反了该法律.
046 声纹识别
机器学习技术加上大数据, 可以让研究人员仅通过声音的微妙信息就识别出你是谁, 福特和大众合作开发的驾驶室精准声纹识别, 可以检测到驾驶员是否醉驾或处于疲惫状态.
047 姿势识别
姿势识别技术现在已经可以通过翻译动作识别我们的身份, 并代表我们做出决定. 自然用户接口 (NUIs) 是未来很多技术的组成部分, 2019 年, 我们将看到更多 NUIs 帮助我们通过身体姿势控制机器, 且工作场所将出现记录我们的身体动作, 预测我们生产效率最高时段的设备.
048 个性识别
越来越多的分析工具将出现, 收集关于你的数据, 行为和偏好, 为你进行个性画像, 以预测你在所有场景下可能有的反应, 目标是预测你的特定需求和意愿, 如未来的资金交易情况等.
049 情感识别
去年, 亚马逊为一个新系统申请了专利, 该系统根据用户之前和当前的互动检测用户的身体和情绪健康状况. 如果它发现你生病了, 那么亚马逊会推荐一小时送药到家. 汽车制造商起亚于 2019 年在 CES 上首次推出其实时情感自适应驾驶系统(R.E.A.D.), 这个识别系统可以通过传感器监控乘客的面部表情, 心率和皮肤活动, 调整车辆内部环境以适应乘客的情绪状态.
050 骨识别
2018 年, 美国空军申请了一项专利, 该专利解释了宽带雷达如何通过骨骼结构进行识别. 人类会发射天线向彼此发送信号, 将该人的生物识别雷达特征与数据库中的已知特征进行比较. 对于身体上有螺钉和金属条的人来说, 这是个坏消息, 因为人类肉眼看不到的东西在扫描时会变成清晰的信标.
051 基因识别
消费者基因检测可以让人们更轻松地了解自己的祖先, 但同时让人们在未授权的情况下变成检测的目标. 现在, 人类的原始生物数据可以被上传到 GEDmatch 等开源数据库中, 允许用户在所有 DNA 平台上寻踪溯源. 此外, 在未经过你本人的同意的情况下, 消费级 DNA 检测机构共享的数据可能会被第三方合法使用. 2018 年, 23andMe 收取了 3 亿美元把数据共享给了医药公司 GlaxoSmithKline.
052 通用基因数据库
消费级 DNA 检测服务为保险, 医药等行业提供了无数的机会, 但是目前还有一个疑点存在: 在什么情况下, 第三方能够提取并使用私人数据库中的遗传数据? 沙特阿拉伯, 科威特, 英国和中国政府一直在研究是否应该建立一个公民遗传信息通用数据库.
智能城市排名
此外, 该报告还给出了一个 2019 年全球智能城市 Top50 排名, 中国无锡, 银川, 杭州, 上海四座城市上榜.
最后, 这份报告还涵盖了包括新能源, 航空航天, 农业在内的其他众多领域的技术趋势, 但是由于篇幅所限, 我们不能一一翻译整理, 感兴趣的朋友可以关注 AI 前线公众号并在公众号后台回复 "技术趋势报告" 查看报告完整版.
来源: http://www.tuicool.com/articles/2y2yIzr