达观数据孙亚彬:如何做好非结构化数据文本智能审阅市场


    虽然是创业型公司,但因为在盛大、腾讯等知名科技公司所做的深厚积累,达观数据备受市场青睐。目前,公司的主营业务立足于非结构化数据处理中的文本处理。2017年,公司营收同比增长3-4倍,达到盈亏平衡。作为数据界的“复旦系”,达观数据是如何立足于数据市场的
    致力于非结构化数据文本智能审阅市场
    “虽然是一家创业型的公司,但实际上在专业领域达观数据已经有了深厚积累。我们创始人陈运文博士,最早是在盛大文学,包括全国百分之七八十的小说文学网站数据的体系搭建都是由陈博团队所领导的,这也成为腾讯文学的前身。后来,陈博带领着这个团队一同创办了达观数据。所以,虽然是创业型公司,我们在专业的挖掘上还是有深厚的积累。”对于达观数据的创立背景,公司市场总监孙亚彬如是表示。
    目前,达观数据的业务主要立足于非结构化的文本数据处理。对于何谓非结构化文本,孙亚彬解释说:“我们通常所理解的数据分析公司,大部分是处理结构化的数据。但事实上还有大量的,占到总量60%以上的非结构化数据,文本是非结构化数据中的一种,因为目前市场上大部分产品的处理能力还比较弱,所以还没能把它很好的挖掘出来。”
    其举例说,在银行的信贷部门,当有很多消费者申请借款,无论是提交的申请报告,还是银行签订的合同,都需要进行大量的审计。用人工进行审核会耗费大量的时间和精力,而且因为人的精力有限,工作效率的降低,让审计的准确率也随之降低。但对于基于数据处理的机器来说,就可以避免这样的问题,机器的效率会快很多,准确率也可以达到更高的水平。在达观为国内知名保险公司提供的财务审阅系统中,财务信息提取准确率达高到98%。
    “所以,我们提供的系统就是代替人做机械化和重复性的工作。机器可以自动阅读文档内容,阅读合同,我们把关键核心信息进行提取,把可能存在的错误内容标识出来,这样审核人员就不需要检查整个文档,只要看标注出来的可能存在的错误信息便可,大大减少了人员的处理时间,也提升了整个的工作流程效率。”
    基于以上业务,达观数据的文档智能审阅系统可协助金融、制造、通信、法律、审计、媒体、政府多个行业的文字密集企业完成文档审阅工作。
    
    
    1  2  下一页>