夏乙 若朴 发自 凹非寺量子位 出品 | 公众号 QbitAI
F8 开发者大会第二天, Facebook 亮出了一系列 AI 大动作.
Caffe2 和 PyTorch 合体事件有了清晰的发展方向, 同样服务于深度学习开发者的 ONNX 也宣布支持更多的框架.
另外, Facebook 开源了视频理解, 自然语言处理的模型, 开源了围棋 AI ELF OpenGo, 还展示了一个打星际的 AI.
PyTorch
v0.4.0 正式版发布没几天, Facebook 在 F8 开发者大会第二天宣布将发布 PyTorch 1.0, 还提前展示了这款新框架的特性.
这个框架, 还换了 LOGO:
深度学习框架 Caffe2 的作者贾扬清, 在知乎上将这一版本的发布总结为 Caffe2 + PyTorch = PyTorch 1.0.
也就是将原本两款框架面向研究的和面向生产的特性结合了起来.
Facebook 介绍说, PyTorch 1.0 结合了 Caffe2 和 ONNX 模块化, 面向生产的特性, 和 PyTorch 自身灵活, 面向研究的特性结合起来, 为广泛的 AI 项目提供了一个从科研原型到生产部署的快速, 无缝途径, 让用户可以快速实验, 通过一个能在强制执行模式和声明执行模式之间无缝切花的混合前端优化性能.
除了将研究和生产特性结合起来, PyTorch 1.0 还将 ONNX(开放神经网络交换)包含进来. ONNX 是 Facebook 去年联合多家软硬件公司发布的神经网络模型转换协议, 现在, 它新增了对苹果的 Core ML, 百度 PaddlePaddle, 高通 SNPE 的支持, 再加上原本支持的 MXNet,Caffe2,PyTorch,TensorFlow,CNTK 等框架, 实现了神经网络模型在各种主流框架之间的转换.
PyTorch 1.0 beta 版将在今年夏天和用户见面.
不过, Facebook 内部已经用上了. 官方称, Facebook 多款产品和服务都在大规模应用这个新框架, 它每天要处理 60 亿次文本翻译任务.
PyTorch 最初亮相于 1 年多以前, Facebook 的另一款深度学习框架 Caffe2, 则在去年的 F8 大会上正式发布.
不过今年 4 月, Caffe2 已经宣布全部代码并入 PyTorch. 接下来的几个月里, 两款框架原本的组件将深度结合, 成为一个单独的软件包.
就在上周, PyTorch 发布了 v0.4.0 版本, 将 Tensors(张量)和 Variables(变量)合并, 新增了零维张量, 还开始了对 Windows 系统的官方支持.
展示 PyTorch 1.0 的同时, Facebook 还开源了一部分研究成果. 比如用于视频理解的 ResNext3D 模型将于 6 月发布, 视频行为识别模型 Res 2+1 今天就已经开源, PyTorch 中的自然语言理解库 Translate 也将开源.
发布了这么多资源和工具, 去哪找呢? Facebook 还为旗下所有的 AI 资源推出了一个网站:
https://facebook.ai/developers
围棋 AI 开源下载
在 F8 大会上, 还开源了一个围棋 AI:ELF OpenGo.
这个 AI 是 Facebook 团队对 DeepMind 技术的一个重现, 最近他们选择与四名排名世界前 30 的人类高手对战, 取得了 14-0 的胜利.
和 AlphaGo 一样, 这个 AI 的重点也并不只是下围棋, 而是想要更好的解决问题. 现在 ELF OpenGo 已经可以开源下载.
对此, 田渊栋在知乎上有更详细的解答:
我们最近改进了 ELF 框架, 并且在上面实现了 DeepMind 的 AlphaGoZero 及 AlphaZero 的算法. 用两千块 GPU 训练约两到三周后得到的围棋 AI, 基本上超过了强职业的水平. 我们和韩国棋院合作进行了一次测试, 给这个 AI 单卡每步 50 秒搜索时间(每步搜索 8 万个局面), 给人类棋手任意长时间思考, 结果 AI 以 14 比 0 完胜. 参与测试的棋手包括金志锡, 申真谞, 朴永训及崔哲瀚, 在这里我们非常感谢他们的合作, 大家都很尽力, 一些棋局下了三四个小时极其精彩. 应棋手们的要求, 这 14 局棋谱中的 12 局不久将公开.
另外我们也和现在著名的 LeelaZero 比较了下. 我们采用了 LeelaZero 除 ponder 外的缺省配置(约一分钟一步), 及 4 月 25 日的公开权重(192x15, 158603eb), 结果我们的 AI 以 200 比 0 获胜. 在此我们非常感谢 Leela 团队的工作, 对于他们的开源精神, 我们表示由衷的敬意.
这次我们将训练代码, 测试代码及训练出来的模型 (224x20) 全部公开, 首要目的是贯彻我们一直以来坚持的开源方针, 让 AI 为全世界服务. 其次是对于 AlphaGoZero 及 AlphaZero 这样非常优秀的算法, 我们想要提供一个可重复的参考实现, 让全球的研究者们能在这上面继续改进, 充分发挥自己的创造力. 最后是借此机会推广一下我们的 ELF 平台和 PyTorch 深度学习框架, 希望更多的人能使用和完善它.
感谢大家的支持!
田渊栋, 龚渠成 & 马子嫯(Jerry Ma), Shubho Sengupta, 陈卓远, Larry Zitnick
ELF OpenGo 代码及模型的地址:
https://github.com/pytorch/ELF
其他
在 F8 大会上, 还展示了一个可以打星际争霸的 AI,Facebook 也计划随后开源这一项目. 星际争霸和围棋一直也都是 Facebook 团队研究的方向.
还有一项突破研究. 基于 35 亿张用户已打标签 (17000 个) 的公开图像, Facebook 成功训练了一个图像识别系统, 这比之前只能用手动打标签的 5000 万张图片训练相比, 提高了系统的识别能力, 在 ImageNet 上获得了创纪录的高分(准确率 85.4%).
更多信息, 可以参考这个页面:
https://code.facebook.com/posts/1700437286678763/
此外, F8 大会上还展示了 AR 和 VR 方面的进步.
Facebook 已经创建了一个原型系统, 可以生成效果惊人的三围重建画面. 下面这个视频, 展示了正常的视频与 3D 重建画面的比较, 几乎难以分辨左右哪个画面为真.(友情提示: 左边露出操作员脚部的是真实世界)
- 完 -
来源: https://juejin.im/entry/5aeaac2ef265da0ba469a047