从下图来看 "神经网络" 时代的到来似乎很可怕.
那么, 上图的可怕场景又是如何开始的呢?
生成对抗网络的进步
什么是生成对抗网络呢? 如果把经过深入研究的神经网络 (如图像分类器) 看作是神经网络技术的左半球. 这样来看就很容易理解什么是生成对抗网络了. 生成对抗网络相当于是神经网络技术的右半球 -- 并且它是具有创造力的.
生成对抗网络 (GANs) 是神经网络技术学习创造力的第一步. 典型的 GAN 是一种基于特定的主题, 利用图像数据集和随机噪声作为种子来生成图像的神经网络. 到目前为止, GANs 生成图像的质量较低, 分辨率也有限. NVIDIA 公司最近的研究成果 http://research.nvidia.com/sites/default/files/publications/karras2017gan-paper.pdf 表明, GAN 能够在高分辨率下生成逼真的图像, 并以开放访问的方式发布了这项技术.
上图为 GAN 图像的例子, 有些很逼真的, 有些不太逼真.
带条件约束的 GANs 和变分自编码器
众多的 GANs 类型对应拥有各种各样的复杂性, 体系结构和奇怪的缩写词, 但这里我们主要讨论带条件约束的 GANs 和变分自编码器. 带条件约束的 GANs 不仅能够模仿生成 "卧室","脸","狗" 等广泛类型的图像, 而且能够深入地模仿生成更加具体类别的图像. 例如, Text2 图像网络 https://github.com/emansim/text2image 能够将关于图像的文本描述翻译成图像.
通过改变与 "含义" 向量相连的随机种子, 能够产生无数鸟类图像, 并且图像与描述匹配.
机会
闭上眼睛, 想象 2 年后的世界. NVIDIA 等公司会把 GAN 技术推向行业成熟水平, 就像他们对待名人面孔一样. 这意味着, GAN 将能够根据文本描述生成任意图像, 并且能够按需生成, 动态生成. 这也将会导致许多摄影和设计相关的行业过时, 下面是 GAN 技术的工作原理.
同样, GAN 能够通过改变随机种子产生无数图像.
个性化
这是比较可怕的一部分, GAN 不仅可以通过目标对象的描述来生成图像, 还可以通过用户活动目录的向量来生成图像. 活动目录能够深入地描述用户的个性, 网页浏览历史, 最近的交易和地理位置, 所以 GAN 生成图像具有一次性, 独特性且符合用户喜好. 正因如此, 网络的点击率才会暴增.
通过测试用户的反应, GAN 将做出改变并使推送给用户的广告更符合其喜好, 直击用户弱点.
泡沫趋势
因此, 在一天结束的时候, 我们在互联网上随处可见的是完全个性化的内容.
每个用户看到的是包含所有内容的完全自定义版本, 自定义版本是根据用户的生活方式, 观点和历史记录改编的. 最近的美国大选之后, 我们看到了这种泡沫模式的觉醒, 所以个性化情况会越来越严重. GANs 能够为用户精确地定位内容, 而不受媒介的限制 -- 从图像广告到复杂的观点, 想法和出版物, 这些都是由机器设备生成的. 这将形成一个持续的反馈循环, 并根据用户的交互进行改进. 而且不同的 GAN 之间会有竞争, 这是一场以人类为战场, 完全自动化的战争. 可想而知, 利润是这一趋势背后的推动力.
这不是可怕的世界末日场景, 这样的场景实际上发生在今天.
这是好事还是坏事?
我也不知道. 但是能够确定的是, 公众对于 GAN 技术的广泛讨论是不可避免的, 我们需要制定后备计划阻止舆论. 所以现在需要考虑的是 -- 我们该如何应对公众的讨论并从中获益.
技术方面的问题
由于技术的限制, 我们还没有到上面所述的地步. 直到最近, GAN 生成图像的质量还是比较差, 且图像易被发现是假的. NVIDIA 公司表示, GAN 实际可以生成分辨率为 1024x1024 且非常逼真的人脸图像. 为了推动 GAN 技术的发展, 我们需要更快更大的图形处理器, 更多关于 GAN 的理论研究, 更多关于 GAN 训练的好方法, 更多标记数据集等.
但是请注意, 我们不需要新的电源, 量子处理器(有一定帮助), 可生成逼真图像的一般人工智能以及其他纯理论的新事物. 大公司可能已经拥有了上述资源, 所以我们所需要的只是几年时间.
此外, 我们还需要更智能的神经网络. 我正在寻找关于 Hinton 等人所研究的神经元组方法 https://arxiv.org/abs/1710.09829 的突破. 我们在超分辨率技术 https://letsenhance.io/ 中首次使用了神经元组方法, 当然这也得益于 GAN 的进步.
数十款阿里云产品限时折扣中, 赶紧点击领券开始云上实践吧!
来源: https://yq.aliyun.com/articles/629547