在即将告别 2017 年之际,KDnuggets 向多位机器学习和 AI 专家询问了哪些是 2017 年最重要的发展,以及他们对 2018 年关键趋势的预测有哪些。这份报告试图抓住 2017 年的重要事件,以及产业、学术和技术发展的脉搏,同时也尽力去展望即将到来的 2018 年的关键趋势。
被采访者是大数据、数据科学、人工智能和机器学习领域的一些顶尖专家。具体来说,采访的问题是:"在 2017 年,与机器学习和人工智能相关的主要发展是什么?2018 年,你认为将看到哪些关键趋势?"
作为一个快速的回顾,去年的趋势和预测主要集中在以下议题:
AlphaGo Zero 令人兴奋,云竞争激烈
Xavier Amatriain:Curai 的联合创始人兼 CTO,之前是 Quora 的工程副总裁和 Netflix 的研究 / 工程总监。
如果一定要选一个今年的主要亮点的话,那就是 AlphaGo Zero 。这一新方法不仅在一些最有前途的方向上得到改进(例如深度强化学习),而且它还代表了一种范式转换,即模型可以在没有数据的情况下学习。最近我们也了解到, AlphaGo Zero 还能推广到象棋等其他游戏 。
至于人工智能的工程方面,2017 年 Pytorch 开始升温,成为 Tensorflow 的一个对手,特别是在研究领域。
Tensorflow 通过在 Tensorflow Fold 中发布动态网络,迅速作出反应。大公司之间的 "AI 战争" 还包括许多其他的战役,其中 竞争最激烈的是云 。所有的主要供应商都增加了云的投入,并在云上增加各自的 AI 支持。亚马逊在他们的 AWS 中提出了大量的创新,比如他们最近发布 Sagemaker 用于构建和部署 ML 模型。另外值得一提的是,较小的玩家也在不断进入。Nvidia 最近推出了他们的 GPU 云,这将成为训练深度学习模型的另一个有趣的选择。尽管有这么多竞争,但这个行业必要时可以团结起来,这是件好事。新的 ONNX 神经网络表示标准是实现互操作性的重要而且必要的一步。
2017 年,围绕 AI 的社会问题也在延续(升级)。伊隆 · 马斯克(Elon Musk)认为我们越来越接近 杀手 AI 的观点继续发酵,令许多人感到沮丧。关于 AI 在未来几年将如何影响工作,也有很多讨论。最后,我们看到更多的焦点放在 AI 算法的透明度和偏见上。
深度学习模型需要透明度
Georgina Cosma:诺丁汉特伦特大学科学与技术学院高级讲师
机器学习模型,尤其是深度学习模型,正在对医疗、法律体系、工程和金融等关键领域产生重大影响。但是,大多数机器学习模型不容易解释。在分析和诊断模型中,理解模型是如何实现预测的尤其重要,因为人类必须要有足够的信心去相信模型提出的预测。重要的是,一些机器学习模型的决定必须与法律法规相符。现在是创建足够透明的深度学习模型以解释它们的预测的时候了,特别是当这些模型的结果被用来影响或告知人类决策时。
AlphaGo Zero 很伟大,但还算不上是突破
Pedro Domingos:华盛顿大学计算机科学与工程系教授,《终极算法》作者。
2018 年将是 AI 成熟的一年
Ajit Jaokar:主任数据科学家,牛津大学物联网数据科学课程的创建者。
2017 年是 AI 的一年。2018 年将是 AI 成熟的一年。我们已经从更多是 "系统工程 / 云" 的角度看到这一趋势。AI 正在变得越来越复杂,h2o.ai 这类公司则简化了部署 AI 的复杂性。
AI 正越来越多地用于竞争优势,尤其是在工业物联网、零售和医疗领域,这将导致更大的颠覆。AI 也正在迅速地部署到企业的各个层面(带来许多新的机会,但也将导致更多职业消失)。
我认为 AI 正在通过嵌入式 AI(即跨越企业和物联网的数据科学模型)融合传统的企业和更广泛的供应链。
最后,传统行业将继续缺乏懂得 AI / 深度学习技术的数据科学家,例如银行业(尤其是工业物联网领域)。
智能自动化将渗透到各行各业
Nikita Johnson:RE.WORK 创始人
2017 年,ML 和 AI 的发展取得了巨大的进步,尤其是最近 DeepMind 发表的通用强化学习算法,在自我对弈 4 个小时之后,击败了世界上最好的象棋程序。
2018 年,我期望看到智能自动化渗透到各行各业的公司,从传统制造业、零售业到公共事业。随着数据收集和分析的不断增加,企业级自动化系统策略的需求将变得至关重要。这将使企业能够投资于一个更长期的 AI 计划,并确保它是未来增长和效率提升的优先事项。
我们还将看到自动化机器学习帮助非 AI 研究人员更容易使用机器学习技术,并使更多公司将机器学习方法应用到他们的工作场景。
meta-learning 和 few-shot learning
Hugo Larochelle:谷歌研究科学家,加拿大高级研究所 Learning in Machines and Brains 项目副主任
在机器学习的趋势中,我最感兴趣也最关注的是 元学习(meta-learning) 。元学习是一个特别宽泛的概括性术语。但今年,对我来说最令人兴奋的是 few-shot learning 的进展,它解决了发现学习算法的问题,这些算法从很少的样本中得到很好的泛化。 Chelsea Finn 今年年初针对这个问题写了一篇很好的总结文章:bair.berkeley.edu/blog/2017/07/18/learning-to-learn/。
今年有更多关于 few-shot learning 和 meta-learning 研究,包括使用深度时序卷积网络(arxiv.org/abs/1707.03141),图形神经网络(arxiv.org/abs/1711.04043)等等。meta-learning 方法也被用于主动学习(arxiv.org/abs/1708.00088),冷启动项目推荐(papers.nips.cc/paper/7266-a-meta-learning-perspective-on-cold-start-recommendations-for-items),few-shot 分布估计(arxiv.org/abs/1710.10304),强化学习(arxiv.org/abs/1611.05763),分层 RL(arxiv.org/abs/1710.09767 ),模仿学习(arxiv.org/abs/1709.04905),等等。
这是一个令人兴奋的领域,2018 年我会继续密切关注。
2018 年将成为全球 "AI first" 经济的突破之年
Charles Martin:数据科学家、机器学习 AI 顾问
2017 这一年,我们看到了一个巨大的深度学习 AI 平台和应用程序。今年,Facebook 发布了他们的 Tensorflow 竞争对手 PyTorch。Gluon, Alex, AlphaGo 等等成果不断。 机器学习从特征工程和逻辑回归发展到阅读论文,实现神经网络,优化训练效果。在我的咨询实践中,客户已经在寻求自定义对象检测,高级 NLP 和强化学习。当市场和比特币飙升的时候,人工智能一直是一场沉默的革命,零售业的启示激起人们认为人工智能将颠覆行业。公司都想要进行自我变革。我们非常感兴趣进行 AI 指导,包括技术层面和战略层面。
2018 年必将成为全球 "AI first" 经济的突破之年。我们有来自欧洲、亚洲、印度、甚至沙特阿拉伯的需求。全球需求将继续增长,来自中国和加拿大的人工智能进步很大,印度等国家正从 IT 重新调整为人工智能。美国和海外的企业培训需求都很大。人工智能将实现大规模的效率,传统行业(如制造业,医疗保健和金融)将从中受益。人工智能创业公司将把新产品推向市场并全面提高投资回报率。而从机器人到自动驾驶汽车的新技术将会带来惊人的进步。
对于创新而言,明年将是伟大的一年。
以工具为中心的方法将减少,重要的是开发和实现利用深度学习的新想法和应用
Sebastian Raschka:密歇根州立大学应用机器学习和深度学习研究员和计算生物学家,《Python 机器学习》的作者。
在过去的几年中,开源社区已经就所有新出现的深度学习框架进行了大量的讨论。现在,这些工具已经有所成熟了,我希望以工具为中心的方法会有所减少,期待将更多精力用于开发和实现利用深度学习的新颖想法和应用。我尤其期望看到用生成对抗神经网络和 Hinton 的 capsule 来解决更多问题。
"AGI" 将会取代 "AI" 成为流行词
Brandon Rohrer:Facebook 的数据科学家。
2017 年还有更多机器击败人类的成就。去年,AlphaGo 击败了世界上最好的人类棋手,通过了智慧之路上的一个长期里程碑。今年,AlphaGo Zero 通过从零开始的自我对弈学习,超越了它的上一版本。(deepmind.com/blog/alphago-zero-learning-scratch)它不仅击败了一个人类,还击败了全体人类的围棋智慧。更实际的兴趣,一台机器现在可以从交换机基准来转录电话交谈。 (arxiv.org/abs/1708.06073)
然而,人工智能的成就仍然狭窄和脆弱。改变图像中的单个像素可以击败最先进的分类器。 (arxiv.org/pdf/1710.08864.pdf)我预计 2018 年将带来更多通用和强大的 AI 解决方案。几乎每个主要的科技公司都已经有了一个人工智能的工作。这些团体及其早期成果将成为头条新闻。至少,"AGI" 将会取代 "AI" 成为当年的流行词。
机器学习系统 "隐藏" 技术欠下的债不容忽视
Elena Sharova 是一家投资银行的数据科学家。
要说 2017 年机器学习 / 人工智能主要的发展,我看到越来越多的公司和个人将他们的数据和分析转移到基于云的解决方案,对数据安全的重要性的意识也急剧上升。
最大和最成功的技术公司已经竞相成为数据存储和分析平台。对于数据科学家来说,这意味着他们所开发的工具箱和解决方案正被这种平台所能提供的功能和能力所塑造。
2017 年,全球发生了几起大型数据安全漏洞。这一点不容忽视。随着越来越多的数据转移到第三方存储,对于适应新威胁的更强大安全性的需求将继续增长。
至于 2018 年的关键趋势,一个是确保遵守《全球数据保护条例》(GDPR),另一个则是应对机器学习系统 "隐藏" 技术欠下的债,这笔债正在越变越多,不容忽视。GDPR 作为一项欧盟法规,具有全球影响力,所有数据科学家应该充分意识到它对自己工作的影响。根据 Google 的 NIPS'16 论文,数据依赖性代价高昂,而且随着企业创建复杂的数据驱动模型,他们将不得不仔细考虑如何解决这一成本问题。
数据科学家正认识到无监督深度学习的价值
Tamara Sipes,Optum/UnitedHealth Group 商业数据科学总监
2017 年的主要发展和 2018 年的主要趋势:
深度学习框架变得更加用户友好且易于访问
Rachel Thomas,fast.ai 创始人,USF 助理教授。
虽然不像 AlphaGo 或者波士顿动力会后空翻的机器人那样华丽,但让我感到最兴奋的 2017 年 AI 趋势,是深度学习框架变得更加用户友好且易于访问。今年发布的 PyTorch,对任何了解 Python 的人都很友好(主要是由于动态计算和 OOP 设计)。不过,TensorFlow 也正朝着这个方向发展,将 keras 纳入其核心代码库并宣布动态图运算。编码人员使用深度学习的门槛正变得越来越低。我预计 2018 年,这种开发人员可用性增长的趋势将持续下去。
第二个趋势是媒体报道专制政府监督人工智能的能力。2017 年爆出了很多威胁隐私的新闻,但直到最近这才开始受到广泛的关注。利用深度学习来识别戴着围巾和帽子的示威者,或者通过图片来识别某人的性取向,使得今年有更多的媒体开始关注 AI 的隐私风险。希望在 2018 年,我们可以继续扩大讨论马斯克说的邪恶超级 AI 的话题,并解决通过编码涉嫌监视、隐私和对性别歧视和种族主义偏见的问题。
"可解释的 AI" 作为一门学科出现
Daniel Tunkelang 是 Twiggle 的首席搜索传播者,也是众多知名组织的顾问。
2017 年对于自动驾驶汽车和会话数字助理来说都是一个大年。这两个都是深度学习将科幻小说变为事实的应用领域。
但是,今年机器学习和人工智能最重要的发展,是对道德、问责和可解释性的持续关注。马斯克关于人工智能触发世界大战的启示性警告点燃了媒体,Oren Etzioni 和 Rodney Brooks 等人则认真反驳。尽管如此,机器学习模型偏差的风险仍然存在,比如 word2vec 中的性别主义,算法在刑事判决中的种族主义,以及对社交媒体信息流的评分模型的故意操纵。这些问题都不是新出现的,但是机器学习的加速应用,特别是深度学习的大量使用,已经将这些问题推到了普通公众面前。
2017 年,我们终于看到 "可解释的 AI" 作为一门学科出现,汇集了学者、业界从业者和政策制定者的参加。2018 年,照亮深度学习模型黑箱的压力和动力都将进一步加大。
原文发布时间为:2017-12-18
来源: https://yq.aliyun.com/articles/292720