制止假新闻传播,谷歌、Facebook如何用好AI这把剑?


    近日,谷歌和其他一些科技巨头包括Facebook和Twitter就如何应对虚假新闻的传播签署了一项行为准则。实际上,继虚假新闻的严重性和传播范围在2016美国总统大选和英国脱欧公投之后被曝光后,脸书、谷歌和推特等科技和广告公司一直面临欧盟立法机构和世界各国政府的批评,被要求严肃对待虚假新闻的处理问题,防止未来再发生类似恶意行为。
    目前,陆续有一些国家开始“出手”整治虚假新闻:印度将为全国716个县配备社交媒体监测员,以监测印度网上舆情和所有在线内容;德国推新法“净化”社交媒体,若其不及时删除平台上的仇恨言论及破坏他人名誉的虚假新闻等非法内容,将被处以最高可达5000万欧元的罚款;埃及国会通过媒体监管法案,凡在社交媒体上拥有超过5000名粉丝的账户和博客都将受到埃及媒体管理最高委员会的监督。若其发布虚假新闻或有煽动违法等行为,埃及媒体管理最高委员会将有权暂停和屏蔽个人社交账户……
    实际上,谷歌和脸书等科技公司也一直在考虑如何将AI技术应用到虚假新闻的打击中。
    使用AI来衡量信息源的质量
    大多数情况下,网民并不是直接的虚假新闻的生成者,而更多时候扮演的是传播者的角色。据科技媒体Science News报道,全球多个科研团队已在研发可自动识别新闻真伪的算法。社交网站可以用这些算法来给新闻做初步检查,并在用户打开一篇疑似假新闻时,给用户发一个预警提示。
    10月4日,麻省理工学院CSAIL(计算机科学与人工智能实验室)和QRCI(卡塔尔计算研究所)宣布研究出一种可以识别虚假新闻在传播前的来源和个人政治偏见的AI系统。他们所使用的机器学习算法利用现有文章集合来衡量给定出口的准确性和偏差,该系统或可将不可信赖的新闻信息自动分类。
    自2016年以来,Facebook开始尝试使用“识别虚假新闻”的人工智能工具,并于近期收购了总部位于伦敦的初创公司Bloomsbury AI,以帮助其鉴别消除假新闻。
    据外媒报道,Facebook于3月份推出了Disputed标签。这个标签将出现在这个网站上那些被认定为不准确的新闻下面。Facebook使用AI检查每天在Facebook上分享的数百万个链接,识别出其中的可疑内容,然后将它们发送给事实核查人员。当事实核查人员将链接、图像或视频评级为假,Facebook就会减少访问范围,降低其在用户的news feed中的排序位置。
    今年4月份以来,谷歌对其搜索引擎背后的算法进行了彻底的调整,把具备误导性、虚假在线文章进行排名降级。谷歌还将建立新的规定,鼓励1万多名评估搜索结果的员工标记出带有恶作剧、阴谋论或者"低质量内容"的网页。
    此外,印第安纳大学社交体观察站的研究人员推出了Hoaxy和Botometer两种程序。Hoaxy是一个搜索引擎,不仅可以展示出Twitter上的即时热点事件,并追踪任何在线新闻报道或Twitter标签,还能推测出事件传播的用户中“机器人”的比例。而Botometer是一个打分软件。他可以根据Twitter用户的账号发布的信息,观察这些信息在Twitter上传播方式和路径,结合机器学习算法给每位用户分配分数,以此来判断信息是由真人共享,还是由“机器人”所推动。
    AI制止假新闻传播,到底有没有效?
    实际上,互联网巨头在打击虚假新闻方面可以说是做得越来越好的。去年,百度将自然语言处理、深度学习、图像识别等AI技术引入网络信息安全治理。全年甄别处理的有害信息总量达到451.2亿条,拦截恶意网页全年总量达202.9亿个。
    一项来自斯坦福大学、纽约大学和微软研究院的研究表明,自2016年美国大选到今年7月,Facebook用户对于假新闻的参与度下降超过了50%。对比之下,Twitter的假新闻比例却在上升。初步可以证明,AI对虚假新闻的辨别打击有一定的效果。
    哈佛大学约翰肯尼迪政府学院错误信息斗争项目First Draft的负责人Wardle表示,AI的确可以加快某些耗时的步骤。例如,利用AI检查每天在线发布的大量内容并标记出可能虚假的内容。但是,她同样提出人工智能无法做出最终的判断。“对于机器来说,你如何编码“误导性”呢?即使是人类也难以定义它。生活是混乱、复杂和微妙的,人工智能要做到理解这一点,还有很长的路要走。”
    英国帝国理工学院的计算机科学家Julio Amador Diaz Lopez表示,即使目前这些鉴定算法演化得越来越“聪明”,但面对背景较抽象的报道时,程序可能还是无法像人类一样会意,或辨识其可信度。
    人工智能或许还没有准备好放在真正的内容审查系统上。
    在Symposium/ITxpo 2017会议上,市场研究公司Gartner预测,到2022年,发达经济体的大多数人口"消费"的虚假信息将超过真实信息。Gartner警告称,虽然人工智能被证明在新信息创建方面非常有效,但在扭曲数据创建虚假信息方面,它也很有效。
    Gartne还预计,在2020年前,虚假信息会造成重大财务欺诈事件。2022年,没有一家大型互联网公司在解决这一问题方面能取得完全成功。3年内,一个主要国家将通过法律法规,遏制人工智能生成的虚假信息的传播。