AI时代|大数据成人工智能应用重点

张康康

    
    随着AI技术的细分场景越来越多,人工智能带来的第四次工业革命浪潮已成汹涌之势,众多传统行业借助AI赋能产业结构,不断升级换代与创新变革,新产品也在不断涌现,AI也在潜移默化改变着生活的方方面面,生物识别、视频识别、内容审核、智能安防等。国内更是诞生了诸如旷视科技、商汤科技、极链科技Video++、依图科技等优秀人工智能初创企业。当前,人工智能已经不仅仅是提升工作效率的一种技术手段,同时还在重塑着产业链和价值创造方式。
    人工智能这几年有了这么大的突破,其中一个重要的推动力就是大数据。在大数据这个概念出现之前计算机并不能很好的解决需要人去做判别的一些问题。所以说如今的人工智能不如说是数据智能,人工智能其实就是用大量的数据作导向,让需要机器来做判别的问题最终转化为数据问题。
    技术型的高科技创业公司都喜欢特别的新东西,大数据与几年前的火热相比,近几年关注程度略有下降。大数据这个概念兴起是在2011年至2014年期间,早年的大数据是在大型互联网公司中重度使用和推动的技术,这些大公司面对着前所未有的数据量,需要采集数据,存储数据,清理数据,查询数据,分析数据,可视化数据。而这部分有些由产品来完成,有些由人力来完成,归根结底,对于这一切工作,都需要建立一个数据驱动的文化。
    大数据的价值
    没有数据支撑的个例没有任何参考意义
    在稳定收入的人群里,大约三到五成的人在炒股,据统计,95%的个人投资最终跑不赢大盘,50-70%的频繁短线交易中甚至在亏钱。那么他们为什么还要炒股,一方面是对自己的炒股能力的自信,另一方面看到周边赚钱的个例,让他们觉得炒股赚钱很容易,但是只要看看统计数据,就会得到相反的结论。
    大量数据的意义
    2005年,第一次做机器翻译的Google请来了机器翻译专家弗朗兹.奥科,一年之后做出了当时世界上最好的机器翻译系统,在NIST的年度评审结果中,Google的BLEU得分51%,领先第二名5%,而基于语法规则翻译的SYSTRAN仅为10.79%。奥科的秘诀却还是两年前的方法,利用了比其他研究机构多几千甚至上万倍的数据,训练出一个六元模型。一般来说,要估计N元模型的各个条件概率,要有足够多的数据,N越大,数据要越多。如果多使用两三倍的数据,机器翻译效果会好一点,但是几万倍的数据增加,量变的积累导致质变,就能达到更好的效果。
    大数据的重要性
    
    在医疗保健里面,基因的缺陷和很多疾病都有关系,要想搞清楚其中的关系: 传统的方法是通过实验才能清楚某一段基因的机理,但这可能是个漫长的过程。还需要考虑到它的缺陷带来的身体的变化,再研究这种变化可能导致的疾病,或者什么情况下会导致疾病。但科学家研究几十年,都很难找到很多疾病的关系。 而数据统计方法与这些正好相反,可以从数据出发,找到基因缺陷与疾病在统计上的相关性,然后再反过来分析这种相关性的内在原因。
    人工智能赋能各个行业
    
    随着数据的积累、计算机算力的跃升和算法的优化,人工智能正在让生活变得更高效。人工智能的持续进步和广泛应用带来的好处是巨大的,为了让它真正有益于社会,同样不能忽视的还有对人工智能的价值引导以及伦理调节。
    2020年作为一个重要的时间节点,相关机构预测将会有500亿只能设备接入互联网,这500亿设备都具备感知通讯和一部分处理的能力,他们会时时不断的往服务端传数据,那时人类所采集和传输的数据都只是其中的一小部分,而到了5G时代,数据就不光是为人服务了,也是在为物服务。人工智能也将随着大数据的发展,将智能应用发展得淋漓尽致,在各行各业都得到广泛的应用。包括智能家居,智慧金融,智能客服,智能医疗等各大领域。