今日头条整改首先扩招审核团队，靠机器学习推荐内容已是伪命题？

2024.06.05

    “今日头条将强化总编辑责任制，全面纠正算法和机器审核的缺陷，不断强化人工运营和审核，将现有6000人的运营审核队伍，扩大到10000人。”4月11日早4时33分，今日头条创始人＆CEO张一鸣在其《致歉和反思》信中说。
    作为国内最大的智能内容平台，今日头条一直以机器学习推荐技术引以为傲。此次大幅度扩充运营审核团队，或许是认为，以机器学习为主导的机制，已无法负荷庞大的内容审核工作，需要加大人工辅助力度了。
    指控、处罚、责令关闭内涵段子，今日头条整改行动从本月正式开始
    早从今年3月开始，用户可能或多或少的有所感觉，甚至提出疑问：包含低俗、违法、虚假等内容的今日头条，是不是快要不行了？

    3月8日，央视财经发布《“今日头条”终于上了“头条”！无视监管，竟做起这种“黑勾当”！害苦2．4亿用户...》文章，直指“今日头条”利用“二跳”手段发布虚假广告，严重侵害消费者合法权益，并危害到相关药品企业正常经营；
    3月29日央视《经济半小时》栏目直接指出，今日头条枉顾监管约谈，明着合法，暗中“二跳”广告的“黑勾当”；
    3月30日，就广告违规问题，北京工商行政管理局海淀分局对今日头条行政作出处罚，没收广告费并处以广告费用3倍罚款，总计达94．4万元人民币；
    4月4日，国家广播电视总局对今日头条、快手两家网站的主要负责人进行了约谈，要求全面整改；
    4月9日，多家应用商店下架今日头条APP，暂停其下载服务3周，时间从4月9日15时起至4月30日15时止；
    4月10日，国家广播电视总局责令今日头条永久关停“内涵段子”。当晚，今日头条关停“内涵段子”。

    近一个月的时间，央视及国家相关监管部门接连不断的的指责，几乎在大众面前将今日头条批的体无完肤。为此，今日头条方面承诺，将把4月作为整改月，全面清查产品中存在的问题，并定期向监管部门汇报整改进度，向公众同步整改结果。
    依靠机器学习推荐机制，今日头条仅用6年便成为国内最大的智能内容平台
    从2012年发布第一个版本至今，今日头条仅用不到6年的时间，便发展成为了国内最大的智能内容平台。相关数据统计，截至2017年7月31日，今日头条的日活跃用户数已经达到了1．2亿，较2016年同期翻了一倍多。
    众所周知，机器学习推荐机制是今日头条最大功臣。纵观今日头条推荐的结果看，其智能算法大致走了以下几大流程：
    一、数据抓取，从用户在该平台的浏览动态或其他账号日常动态中抓取相关数据。
    二、用户分析，每个用户都是一个数据库，信息浏览行为越多，其数据库中的数据也越多。智能算法会对这些数据进行整合与分析，从而提炼出该数据库的关键词。
    三、内容审核，智能算法主要做了两件事，消重和审核。
    消重，就是辨别内容相似度，以避免推荐给用户的内容过于重复。显然，这一点，今日头条做的并不好，用户经常会看到相似内容，甚至标题、图片等都很相似；
    审核方面，这是今日头条被严厉指责的关键问题所在。因算法尚未成熟，人工干预度低，导致很多未经人工审核的将色情、低俗、虚假、违法等内容通过了审核。
    四、新闻推荐，这是与用户直接关联的一步。从今日头条的推荐机制看，内容会被推荐与否，与热点、点击量直接挂钩。这是智能算法对内容受欢迎程度的一次判断。
    但显然，今日头条这一内容平台，并没有很好的做到其所期望的。
    虽加大人工审核力度，机器学习推荐内容依旧是大势所趋
    “3月29日央视报道我们的广告问题后，我不断反思自己以前的想法，反思公司现在的做法，开始大力推进公司员工提高意识、改进管理、完善流程。”这是张一鸣的反思之一。
    而随后的行动，就是“强化人工运营和审核，将现有6000人的运营审核队伍，扩大到10000人。”
    显然，今日头条这个人工智能内容平台，已经认识到机器学习的不足，开始更为重视人工了。对此，有网友提出质疑，从人工到人工智能是进步，从机器回到人工，这是历史和科技的倒退？
    去年11月，张一鸣在2017今日头条创作者大会上透露，其头条号账号总数超120万，平均每天发布50万条内容，创造内容消费达48亿次。
    以每个账号每天投稿5条内容算，头条好每天的投稿内容达600万条。除此之外，今日头条旗下还有悟空问答、微头条、西瓜／火山／抖音以及已经关停的内涵段子。该平台每天的投稿、上传内容超4000万。
    仅靠1万的人工，显然是无法完全负荷审核任务的。仅从目前来说，今日头条的审核推荐机制，依旧以机器学习算法为主导，并加以大量人工辅助。
    其实，除了今日头条，新浪微博、微信公众号、快手短视频、界面等平台也有相关的机器学习审核算法的加持。如新浪微博，其会实时更新关键词，如果用户发布的内容涉及到相关关键词，就会被屏蔽或删除。
    而微信公众号作为现今流量排前的内容平台，其在内容审核方面则较为严谨。有过运营经历的人应该经常碰到，一旦提交审核的内容中提及了一些敏感内容或词汇，其审核时间就会非常得长。
    很显然，在平台多元、领域多样、数量越来越庞大的情况下，通过机器学习审核推荐内容是大势所趋。仅靠人工，非得累死。
    不过，当前的机器学习算法能工作质量，还远不及人类，否则，今日头条也就不会陷入如此窘境了。就像扎克伯格曾经说的一样，Facebook对人工智能非常依赖，希望能够通过AI改善审核机制。但想要完全依靠AI审核内容，可能还需要5－10年的时间。
    机器学习算法作为每一次内容低劣指控的“背锅侠”，需要的，可能只是时间和耐心。在没有完全成熟之前，可以是主导，但绝不可以是唯一。技术提升加以人工辅助，是对用户最大的负责。
    “我是工程师出身，创业的初心是希望做一款产品，方便全世界用户互动和交流。因此，在过去几年间，今日头条将更多的精力和资源，放在了企业的增长上。现在，我们必须重新梳理我们的愿景，保证所‘创作’与‘交流’的内容是积极向上的、健康有益的，能够给时代、给人民带来正能量。”张一鸣说的似乎很诚恳。
    最后
    快手的创始人＆CEO宿华曾表示，技术让每个人前所未有的得到了表达自我的机会，但也带了新的社会问题。因为几千年来，人们所适应的，是由人呈现出来的世界。我们需要去适应新的世界。
    当然，这里不得不提一句，机器学习算法是在抓取用户“行为数据库关键词”之后才进行的推荐。如果，你能抵制住低俗内容的诱惑，又怎会被这些内容推荐“干扰”？