消息已经出来了: 俄罗斯大选, 弗拉基米尔. 普京轻松赢得了第四个任期, 对 70% 的得票进行抽查的结果显示, 普京得票率为 75.91%
民意调查显示, 普京的支持率远远超过其他对手, 当选可以说是早成定局然而, 针对俄罗斯的这场大选, 舞弊的质疑声不绝于耳此前俄罗斯非政府研究机构利华达中心的一项调查结果, 有 58%的选民计划抵制这次选举普京最有力的竞争对手, 也因欺诈罪被送入牢狱, 未能参加此次选举
另一边厢, 美国的特朗普也不得安生关于他 2016 年操纵舆情当选总统的报道再一次飞满天, 其中也包括他与俄罗斯勾结的可能美国这边的舆论风暴更加猛烈, 而位于暴风中心的, 是一家数据分析公司, 以及这家公司使用的方法人工智能
这家叫做 Cambridge Analytica 的公司是这两天全美关注的焦点公司内部人士走向前台, 主动公开 Cambridge Analytica 非法获取超过 500 万 Facebook 个人账户信息, 然后使用这些数据构建算法, 分析 Facebook 用户个性资料, 并将这些信息与他们的投票行为关联起来
算法和大数据两相结合, 形成了一种强有力的政治武器, 让竞选团队能够准确识别在两位候选人之间摇摆不定的选民, 并有针对性地制作和投放广告
根据这位吹哨人的表述, Cambridge Analytica 使用这些非法得来的数据, 最终目标是利用这个训练集, 构建一个理解 Facebook 用户个人资料的黄金标准
大数据和 AI 在竞选中的力量: 机器能比人更加精准地掌握人类性格
Cambridge Analytica 首席执行官 Alexander Nix 在 2016 年的一次演讲中, 详细阐述了这家公司的方法论: 我们推出了一个长表 (long-form) 量化工具来探究人格的基本特征如果你知道了目标人物的个性, 你就可以细化信息, 更有效地与这些关键群体产生共鸣
Cambrige Analytica CEO 在会上演讲大数据和心理分析在竞选中的力量
Cambridge Analytica 通过收集到的数据我们先把数据收集方法放在一边建立了模型, 并将其转化为美国成年人的个性概况 Nix 声称, 他们在美国每个成年人身上大约有 4000 或 5000 个数据点(data points)
他们模型的基础, 是 Michal Kosinski 的心理测量学研究, Kosinski 在 2013 年是剑桥大学的一名博士候选人 (这也是 Cambridge Analytica 公司名字的由来)Kosinski 和他的同事开发了一个模型, 将受试者在 Facebook 上的点赞(like) 与他们的 OCEAN 分数联系起来 OCEAN 是心理学家使用的一种调查问卷, 描述了五个维度的人格开放 (openness to experience) 自律 (conscientiousness) 外向 (extraversion) 随和 (agreeableness) 和神经质(neuroticism)
Cambridge Analytica 公司将这种社会心理与数据分析结合起来他们从 Facebook 和 Twitter 收集数据, 并从第三方那里购买一系列其他的数据, 比如电视偏好航空旅行购物习惯去教堂的频率订阅的杂志等等然后, 他们将所有这些信息用于 Nix 所谓的行为微观定位(behavioral microtargeting), 简单说就是个性化广告
Cambridge Analytica 使用心理测量学而不是根据人口统计来定制广告, 以选民个人的情感内容为目标换句话说, 就是为了激发人类情感上的偏见而设计广告
这种方法成功与否, 或者有多成功, 取决于对人心理概况的掌握我们是否能够根据社交网络上的评论留言和推文来了解一个人的心理状况?
答案是肯定的
Kosinski 在他 2016 年接受采访时, 谈到了他的模型的预测能力 70 个喜欢就足以超过这个人的朋友对他的理解, 150 个就能超过他的父母, 300 个超过伴侣, 更多的喜欢能让模型比这个人本身都更了解他自己
或许这是 Kosinski 在王婆卖瓜, 但研究早已证实, 机器能比人类更加精确地判断人类的性格特征, 这与社交认识能力无关, 一切都在大数据
2015 年发表了 PNAS 的一项研究表明, 计算机模型基于数字足迹对人物性格的判断, 比亲密的人 (朋友, 家人, 配偶, 同事等) 所作的判断更准确和有效研究人员表示, 我们的研究结果强调, 人的个性可以自动预测, 而不涉及人类的社会认知技能
利用 AI 和大数据控制公众舆论: 从假新闻到换脸, 初中高三级进阶
将机器的这种预测能力与一群 bot 结合起来, 就成了更加强大的宣传工具牛津大学互联网研究所计算宣传项目 (Computational Propaganda project) 负责人 Samuel Woolley 说: 控制一千个僵尸计算机帐户的一个人, 不仅能够影响他们直接圈子中的人, 还可能影响他们操作的网站的算法
这些技术可以捕捉到人们在某个特定时刻的想法, 并一次又一次地向他们提供服务不仅如此, 活跃在网络中的 bot 能够对 Twitter 和 Facebook 上的热门话题做出迅速的反应, 生成有针对性的帖子图像, 甚至 YouTube 视频
随着大数据和人工智能的发展, 利用相关技术开展社会学研究已经成为一种趋势然而, 就如上文所说, 利用这些技术同时也能影响甚至操控人和社会本身
牛津大学互联网研究所计算宣传研究项目 (Computational Propaganda Research Project,COMPROP) 就专门针对这种新的现象, 调查算法自动化和政治的相互作用研究人员的工作包括分析如何利用社交媒体机器人等工具, 通过放大或压制政治内容假情报仇恨言论和垃圾新闻来操纵公众舆论
项目官网介绍: 我们使用组织社会学, 人机交互, 沟通, 信息科学和政治科学的观点来解释和分析收集到的证据
新智元也简单梳理了 AI 和大数据在总统竞选中的应用
初级篇: Fake News, 制造假新闻在 Facebook 上传播
2016 年, 特朗普当选总统, 假新闻可谓助了一臂之力
在整个竞选期间, 美国的充斥着大量的假新闻 BuzzFeed 在 2016 年 12 月做的一项调查显示, 75% 的美国人看到过假新闻以其中一条假新闻为例, 调查希拉里邮件泄露门的 FBI 特工自杀 - FBI Agent Suspected in Hillary Email Leaks Found Dead in Apparent Murder-Suicide (Fake)这则新闻, 有 52% 的希拉里支持者和 85% 的特朗普支持者认为是真的
而假新闻的制造也有规律可循
纽约时报曾披露, 格鲁吉亚一名 22 岁的计算机专业的学生, 发现特朗普的新闻能够为自己的网站带来流量, 于是他频繁发布有关赞美特朗普反希拉里的故事, 做法常常只是简单地剪裁和粘贴, 有时会篡改标题, 但主要是复制其他地方的材料, 就是通常所说的洗稿最终, 使网站广告销量飙升
当时, 一些分析人士认为, 美国假新闻可能跟外国情报机构干预美国政治影响选举有关不过自然最近发布的研究认为, 2012 年和 2016 年美国总统选举期间, 政治类假新闻的数量明显增多, 但假新闻主要由公众分享, 而非机器人账户自动传播公众之所以更喜欢分享假新闻, 是因为它更加耸人听闻
尽管如此, 在传播的过程中, Facebook 成为重要的渠道, 对假新闻的处置力度不够, 这也是马克. 扎克伯格年初放话整顿公司的原因现在, Facebook 改变了信息流的呈现方式, 优先为用户推荐好友的新闻
除了假新闻外, 机器人水军也是为总统选举造势的一股力量
2017 年 1 月 17 日, Girl 4 Trump USA 加入注册了 Twitter 账户一个星期之后的 1 月 24 日, 她突然忙碌起来, 每天平均发布 1289 条推文, 其中许多是在支持总统特朗普的内容当 Twitter 发现 Girl 4 Trump USA 是一个机器人的时候, 她已经发布了 34800 次推特
后来, Twitter 发现了大量此类的用户, 这就是我们熟悉的水军, 在国内社交平台上也经常见到但 Twitter 无法阻止其平台上的水军机器人, 而且后者的手段也越来越隐蔽
中级篇: Fake Video, 以假乱真, AI 换脸变声
去年, 华盛顿大学的研究人员用神经网络来观看视频, 并将不同的音频声音转换为基本的嘴形, 根据音频剪辑生成逼真的视频, 让嘴巴的运动和音频同步
不过, 这还不是最厉害的
不久前, Reddit 上一名叫 deepfakes 的用户, 创造一种机器学习算法, 可以允许人们用简单的视频和开源代码制作出一条假的色情视频, 并将原视频的女主角换脸
后来, deepfakes 还开发出一款 Fake APP, 进一步把技术门槛降低到 C 端
特朗普的脸换到希拉里身上
最后, 由于技术太逆天以及违反道德, Reddit 就把相应的社区封了
除了制造假视频, 音频也是 AI 技术不放过的领域
听听奥巴马说的这段话
奥巴马当然不会说中文, 音频后面的话并非奥巴马自己说的, 而是利用科大讯飞的语音技术合成而来
高级篇: 见微知著, 看车能预测政治倾向
无论是假新闻也好, 假视频也好, 都是下三滥的手段真正把人工智能玩儿的炉火纯青的, 还是要实打实的能力
2017 年, 李飞飞曾领导斯坦福研究人员, 将人工智能的研究成果应用到人口统计学中: 他们使用具有视觉和学习能力的算法分析了 Google 街景视图上的数百万个公开可用的图像研究人员说, 只要看看街上的汽车, 他们就可以利用这些知识来确定某个社区的政治倾向
具体步骤是:
算法进行自我训练, 识别谷歌街景中来自 200 个美国城市的 5000 多万份图像中, 自 1990 年以来生产的每辆汽车的样式型号和年份
然后将有关汽车类型和位置的数据与当前最全面的人口数据库美国社区调查和总统选举投票数据进行比较, 以预测种族教育收入和选民偏好等人口因素
最终, 李飞飞及团队发现了汽车人口统计学和政治劝说之间存在着简单的线性关系简单而言, 如果一个社区的轿车数量大于皮卡的数量, 那么该地区有 88%的可能性会投票给民主党如果皮卡的数量大于轿车, 则该选区投票给共和党的可能性是 82%
人工智能改变政治生态: 研究人员立场最关键
现在, 这种机器人水军 AI 换脸既成为一种技术现象, 也是一种社会现象
如果仅仅从技术角度来看待用技术进行的宣传, 它就会被那些创造它的人服务于它的平台以及从中获利的公司所掌控, 也削弱了为改变社会价值和意义的程度, 因此, 大数据与人工智能研究对于理解技术宣传对政治的影响是必要的
与此同时, 研究人员必须对正在使用和分析的数据保持一个关键的立场, 以确保我们在描述预测或推荐时进行能够批评如果对技术宣传和政治大数据的研究不涉及到权力, 那么提高社交媒体平台在公共生活中的作用的可能性就会消失
如果真的是那样, 那就到了终极篇普京当总统之路了
来源: https://yq.aliyun.com/articles/552860