今日头条整改首先扩招审核团队,靠机器学习推荐内容已是伪命题?
“今日头条将强化总编辑责任制,全面纠正算法和机器审核的缺陷,不断强化人工运营和审核,将现有6000人的运营审核队伍,扩大到10000人。”4月11日早4时33分,今日头条创始人&CEO张一鸣在其《致歉和反思》信中说。
作为国内最大的智能内容平台,今日头条一直以机器学习推荐技术引以为傲。此次大幅度扩充运营审核团队,或许是认为,以机器学习为主导的机制,已无法负荷庞大的内容审核工作,需要加大人工辅助力度了。
指控、处罚、责令关闭内涵段子,今日头条整改行动从本月正式开始
早从今年3月开始,用户可能或多或少的有所感觉,甚至提出疑问:包含低俗、违法、虚假等内容的今日头条,是不是快要不行了?
3月8日,央视财经发布《“今日头条”终于上了“头条”!无视监管,竟做起这种“黑勾当”!害苦2.4亿用户...》文章,直指“今日头条”利用“二跳”手段发布虚假广告,严重侵害消费者合法权益,并危害到相关药品企业正常经营;
3月29日央视《经济半小时》栏目直接指出,今日头条枉顾监管约谈,明着合法,暗中“二跳”广告的“黑勾当”;
3月30日,就广告违规问题,北京工商行政管理局海淀分局对今日头条行政作出处罚,没收广告费并处以广告费用3倍罚款,总计达94.4万元人民币;
4月4日,国家广播电视总局对今日头条、快手两家网站的主要负责人进行了约谈,要求全面整改;
4月9日,多家应用商店下架今日头条APP,暂停其下载服务3周,时间从4月9日15时起至4月30日15时止;
4月10日,国家广播电视总局责令今日头条永久关停“内涵段子”。当晚,今日头条关停“内涵段子”。
近一个月的时间,央视及国家相关监管部门接连不断的的指责,几乎在大众面前将今日头条批的体无完肤。为此,今日头条方面承诺,将把4月作为整改月,全面清查产品中存在的问题,并定期向监管部门汇报整改进度,向公众同步整改结果。
依靠机器学习推荐机制,今日头条仅用6年便成为国内最大的智能内容平台
从2012年发布第一个版本至今,今日头条仅用不到6年的时间,便发展成为了国内最大的智能内容平台。相关数据统计,截至2017年7月31日,今日头条的日活跃用户数已经达到了1.2亿,较2016年同期翻了一倍多。
众所周知,机器学习推荐机制是今日头条最大功臣。纵观今日头条推荐的结果看,其智能算法大致走了以下几大流程:
一、数据抓取,从用户在该平台的浏览动态或其他账号日常动态中抓取相关数据。
二、用户分析,每个用户都是一个数据库,信息浏览行为越多,其数据库中的数据也越多。智能算法会对这些数据进行整合与分析,从而提炼出该数据库的关键词。
三、内容审核,智能算法主要做了两件事,消重和审核。
消重,就是辨别内容相似度,以避免推荐给用户的内容过于重复。显然,这一点,今日头条做的并不好,用户经常会看到相似内容,甚至标题、图片等都很相似;
审核方面,这是今日头条被严厉指责的关键问题所在。因算法尚未成熟,人工干预度低,导致很多未经人工审核的将色情、低俗、虚假、违法等内容通过了审核。
四、新闻推荐,这是与用户直接关联的一步。从今日头条的推荐机制看,内容会被推荐与否,与热点、点击量直接挂钩。这是智能算法对内容受欢迎程度的一次判断。
但显然,今日头条这一内容平台,并没有很好的做到其所期望的。
虽加大人工审核力度,机器学习推荐内容依旧是大势所趋
“3月29日央视报道我们的广告问题后,我不断反思自己以前的想法,反思公司现在的做法,开始大力推进公司员工提高意识、改进管理、完善流程。”这是张一鸣的反思之一。
而随后的行动,就是“强化人工运营和审核,将现有6000人的运营审核队伍,扩大到10000人。”
显然,今日头条这个人工智能内容平台,已经认识到机器学习的不足,开始更为重视人工了。对此,有网友提出质疑,从人工到人工智能是进步,从机器回到人工,这是历史和科技的倒退?
去年11月,张一鸣在2017今日头条创作者大会上透露,其头条号账号总数超120万,平均每天发布50万条内容,创造内容消费达48亿次。
以每个账号每天投稿5条内容算,头条好每天的投稿内容达600万条。除此之外,今日头条旗下还有悟空问答、微头条、西瓜/火山/抖音以及已经关停的内涵段子。该平台每天的投稿、上传内容超4000万。
仅靠1万的人工,显然是无法完全负荷审核任务的。仅从目前来说,今日头条的审核推荐机制,依旧以机器学习算法为主导,并加以大量人工辅助。
其实,除了今日头条,新浪微博、微信公众号、快手短视频、界面等平台也有相关的机器学习审核算法的加持。如新浪微博,其会实时更新关键词,如果用户发布的内容涉及到相关关键词,就会被屏蔽或删除。
而微信公众号作为现今流量排前的内容平台,其在内容审核方面则较为严谨。有过运营经历的人应该经常碰到,一旦提交审核的内容中提及了一些敏感内容或词汇,其审核时间就会非常得长。
很显然,在平台多元、领域多样、数量越来越庞大的情况下,通过机器学习审核推荐内容是大势所趋。仅靠人工,非得累死。
不过,当前的机器学习算法能工作质量,还远不及人类,否则,今日头条也就不会陷入如此窘境了。就像扎克伯格曾经说的一样,Facebook对人工智能非常依赖,希望能够通过AI改善审核机制。但想要完全依靠AI审核内容,可能还需要5-10年的时间。
机器学习算法作为每一次内容低劣指控的“背锅侠”,需要的,可能只是时间和耐心。在没有完全成熟之前,可以是主导,但绝不可以是唯一。技术提升加以人工辅助,是对用户最大的负责。
“我是工程师出身,创业的初心是希望做一款产品,方便全世界用户互动和交流。因此,在过去几年间,今日头条将更多的精力和资源,放在了企业的增长上。现在,我们必须重新梳理我们的愿景,保证所‘创作’与‘交流’的内容是积极向上的、健康有益的,能够给时代、给人民带来正能量。”张一鸣说的似乎很诚恳。
最后
快手的创始人&CEO宿华曾表示,技术让每个人前所未有的得到了表达自我的机会,但也带了新的社会问题。因为几千年来,人们所适应的,是由人呈现出来的世界。我们需要去适应新的世界。
当然,这里不得不提一句,机器学习算法是在抓取用户“行为数据库关键词”之后才进行的推荐。如果,你能抵制住低俗内容的诱惑,又怎会被这些内容推荐“干扰”?