如果说人工智能是未来的 "电力", 那么数据就是发电的 "燃料". 在面向未来技术升级的过程中, 那些拥有大量数据的组织有机会最早利用这些 "燃料" 来发 "电". 这其中, 世界知识产权组织 (WIPO) 在使用人工智能技术方面的实践可以作为有价值的案例之一.
WIPO 是联合国领导的发展国际知识产权制度的专门机构, 是由 191 个成员国组成的关于知识产权服务, 政策, 合作与信息的全球论坛. WIPO 的专利合作条约 (PCT) 是一个国际专利体系, 方便申请人在国际上寻求对其发明的国际专利保护, 帮助专利局出专利授权决定. 通过 PCT 提交国际专利申请, 申请人可以同时在全世界大多数国家寻求对其发明的保护. WIPO 的特性决定了其在专利领域拥有海量的专业数据. 随着全球知识产权申请数量不断增加, 相关数据的数量增长使得不使用 AI 工具采集和分析数据变得几乎不可能. 截至 2017 年 2 月, PCT 已经授权了 300 万件国际专利. 由于在 WIPO 的专利申请数据库中, 大约只有三分之一的文件为英文, 因此在国际专利保护领域, 涉及到大量专利申请文件的翻译工作.
对于像 WIPO 这样的非技术性组织来说, 如何进一步运用自身积累的大量数据资源? 如何使用新技术减少巨大, 枯燥并且重复性人工劳动的工作量? 有没有可能通过技术手段, 帮助工作人员提高专利, 商标等知识产权方面的审查工作? 在这一波人工智能的热潮来临之前, WIPO 早在 2010 年就已经开始进行人工智能技术在专利领域方面的应用探索.
WIPO 在知识产权领域开发和应用人工智能方面一直处于领先地位. 2010 年, WIPO 全球数据库部门的 Christophe MAZENC 招聘到了人工智能应用开发的第一位员工. 两人开始了 WIPO 机器翻译工具的开发工作, 两年以后, WIPO 有了第一个版本的机器翻译工具. 到今天, 这个团队发展成为先进技术应用中心(ATAC), 第一位 AI 开发者 Bruno Pouliquen 也已经成为部门负责人, 管理着 5 人的团队.
ATAC 作为 WIPO 内部的 AI 技术开发部门, 负责自下而上的规划 WIPO 的 AI 应用开发路线, 工作之一是扫描各部门所拥有的数据, 分析在这些数据的基础上可以开发出怎样的应用; 另一方面, ATAC 与 WIPO 各成员国的知识产权局保持沟通, 交换数据, 跟踪成员国知识产权局的人工智能应用进展.
WIPO 采用内部开发而非外包的方式, 自己开发了基于神经网络的机器学习翻译工具 WIPO Translate. 与早期的工具相比, WIPO Translate 对专利文件的翻译更加自然, 尤其是像英文和中文这样差别很大的语言. 与市面上通用的翻译工具使用更广泛的文档进行训练不同, WIPO Translate 完全依靠知识产权相关文档进行训练. 因此 WIPO 的翻译工具在全球专利翻译领域处于领先地位. 在 WIPO 内部的专利数据中用中文, 日文和韩文这三种语言撰写的专利占全世界专利申请量的一半以上. 通过翻译软件帮助工作人员理解专利的内容, 可以减少 WIPO 对外包翻译公司的依赖, 同时提高内部职员的工作效率. 为了评估 WIPO 机器翻译工具的翻译质量, 研究人员使用了一个名为 Bleu 的程序, 由 AI 专家来评估机器翻译系统. 结果表明, 在专利文献翻译领域, WIPO 的表现优于我们常用的 Google 翻译. 2010 年开始做机器翻译项目的只是两个人的微型团队. 发展到今天也仅是五个人的小团队. WIPO 总干事弗朗西斯 高锐 (Francis Gurry) 认为, 一方面专利可以帮助发明人保护和促进他们的发明, 另一方面还披露了其他人可能用来开发新创新的重要细节. WIPO Translate 工具有助于在全球传播这种知识.
来源: http://www.ftchinese.com/story/001078302?adchannelID=2100