文章
AI全面部署?是时候考虑了
发布日期:2021年1月20日
2020年,德勤连续第三年发表《企业人工智能应用现状分析》报告。根据对全球九个国家近三千名企业管理者的访问,报告得出的结论是,人工智能已经跨过“早期应用”的时代,进入技术成熟、全面应用的“早期多数”时代。随着技术的不断进步,人工智能的开发和实施门槛降低,人工智能已经开始被广泛部署于企业的各类业务场景,从管理和自动化信息技术基础设施,到收集关于客户的新洞察、识别和应对网络威胁、帮助指导医疗决策和改进招聘流程等。
企业早期实施的人工智能部署策略更多是各个业务部门各自为战,根据自己的需求,选择一个或若干个特定场景,通过购买或者自建人工智能的解决方案,实现运营的智能化。但是在日益增长的人工智能应用需求面前,这种策略造成了烟囱式的AI部署。
某汽车企业A,财务部为实现报销流程的自动化,购买了一套OCR产品,用于识别各类财务票据和报销凭证。而二手车部门,为了审核二手车返利的申请,也购买了一套OCR产品,用于识别二手车场景中的发票、车辆登记证、行驶证、车牌等。
某零售企业B,市场部门为了预测未来市场走向和销售趋势,组建了自己的数据科学家团队,选择搭建机器学习平台,训练构建预测模型。与此同时,销售客服部门,急迫想知道顾客对于产品、服务、促销手段以及竞品的反馈,他们购买了一套基于机器学习和自然语言处理的商用舆情分析系统。
这些对于人工智能的应用方式在早期是非常普遍的,即以部门为单位,或自建,或购买,针对特定的业务需求,进行人工智能的尝试。自建时可能使用不同的技术方案,购买时也可能选择不同的供应商,这样就形成了一个企业内部烟囱式的AI应用部署。这种部署方式如果任其发展,会造成重复投资,资源无法集中利用,对于正处于数字化转型和智能化转型的企业而言,是亟待解决的问题。
基于公有云的AI部署
从2017年到2019年,国家陆续公布了15家人工智能开放创新平台,涵盖了智能语音、智能视觉等人工智能的基础应用和众多的行业应用,如自动驾驶、医疗、普惠金融、供应链、教育、家居等等。这些开放创新平台多数可以通过公有云为企业进行AI赋能。企业不用考虑投资建立复杂的算力平台、数据标注平台、算法平台、模型训练平台,只需按需调用公有云的AI服务即可。与众多其他的公有云服务一样,这为企业带来了极大的便利性,能够快速实现AI能力的部署,企业只需完全将精力放在业务逻辑上,思考究竟要解决什么实际的业务问题。对于中小企业来说,这尤其具有吸引力。
以OCR为例,目前多家公有云服务商提供了完整的OCR能力,包括通用的文字识别、表格识别以及一些通用的卡证(身份证、驾驶证、行驶证、护照等)和票据(增值税发票、火车票、机票、出租车票等)的识别。除此之外,这些云服务商通常也提供了定制模板的功能,可以帮助企业解决一些特定非标文档的OCR识别。上述提及的汽车企业,如果决定使用公有云的部署方式,完全可以研究并选择一套OCR产品,同时解决财务场景和二手车场景下不同的需求。
有些企业可能拥有自己的一些行业特点,仅仅通过API使用公有云的标准化AI服务,效果不是特别理想,这种情况下,可以考虑公有云服务商提供的在线的AI训练平台。比如阿里云提供的NLP自学习平台,便提供了NLP的行业自适应标注、训练和服务平台,为用户提供许多NLP典型问题(实体抽取、文本分类、关键词抽取、情感分析等)的定制化算法能力。企业不需要有自己的算法专家,用户可以上传自己企业或者行业的标注数据,便可以快速训练自己的模型。
基于公有云的AI能力部署,可能引发一些企业的一个重要的担忧,那就是数据安全问题。许多大型企业,有着严格的数据安全管控要求,无法使用公有云的服务。下面就来探讨针对这类企业的一种AI部署方式。
私有化部署AI中台
许多大型传统企业,由于数据安全等方面的考虑,无法使用公有云的AI服务。而这些企业的AI基础能力比较薄弱,缺少技术和人才的沉淀,但是智能化升级又是企业的刚需,甚至是迫切的需求,这时候借助AI技术公司在企业内部进行AI中台的私有化部署,是比较经济而高效的策略。
和近年来热门的数据中台的思想基本一致,AI中台最终是要以标准化、可复用性实现业务的敏捷化、智能化。企业部署AI中台,可以自建,也可以借助AI技术供应商。借助供应商的好处是可以迅速建立起基础能力,企业利用这些基础能力可以研究开发自己的模型和应用。这真正契合了国家的新基建战略的思路,AI技术公司提供了算力、算法、平台的基础设施,借助这些基础设施,企业可以重点关注业务的创新发展,从而真正实现AI+万业,AI赋能创新型社会的宏伟目标。
2020年,百度推出了基于百度智能云的“AI中台”,帮助企业建立自己的专属人工智能平台。百度AI中台第一个核心能力是AI能力引擎,涵盖了人脸识别、OCR、语音识别、NLP、图像识别、知识图谱等250多项成熟的AI能力,包括全球领先的Ernie算子和百度优化后的主流算法。第二个核心能力是百度开源之后的PaddlePaddle开发框架,以及其他主流的开源框架如TensorFlow,PyTorch等。利用这些的深度学习开源框架, 企业可以结合自己的业务场景,进行AI应用的开发。
对于许多传统企业来说,购买AI中台并私有化部署,使得他们与科技企业的差距大大减小,产业智能化转型也变为可能。某电力企业部署了AI中台之后,实现了管理安全生产、作业防误、线路巡检等多个业务场景的智能化改造。比如对于线路的可视化监控装置,利用AI中台,实现对于图像的边缘智能分析,可以快速发现影响线路安全的事件(比如山火等),工作人员可以及时做出响应。
企业自建AI能力
尽管购买并私有化部署AI中台是一种快速建立AI能力的方案,仍然有许多企业从自身长远发展考虑,倾向于建立自己完整的的AI能力,尤其是那些将科技视为自身核心竞争力,并把研发能力和应用能力看得同等重要的企业。当前AI的许多开源框架也为这些企业提供了自建AI能力的可能性。
eBay便是这类企业的典型。Krylov是eBay基于开源框架自行开发的人工智能平台。从其网站的介绍,我们可以了解到,Krylov是eBay从头开始建造的一个可伸缩的、多租户的、基于云的人工智能平台,以支持各种规模的人工智能用例。 eBay 的数据科学家每月使用 Krylov 运行数千个模型训练试验,这些试验涵盖了各种人工智能用例,如计算机视觉、自然语言处理(NLP)、销售规划建议、买方个性化服务、卖方价格指导、风险、信任、运输估计等等。
eBay建立这个AI平台,从一开始就是一个涵盖了企业多个团队的系统工程,不仅仅有平台的研发者,还有平台服务的提供者和使用者。这些专家一起为 eBay 创建了一个统一的 AI 愿景,包括平台的战略、路线图和关键原则。AI平台还在往社区方向发展,eBay设立了一个机器学习(ML)工程奖学金项目,任何在 eBay 的工程师都可以加入到人工智能平台团队中,类似于一个实习项目,帮助构建产品待办列表中的平台特性。这个奖学金项目的目的是让 eBay 工程师熟悉 ML 的概念和技术。参与者会获得来自资深领域专家的关于 ML 工程概念的指导。
eBay或许还是被人们认为是科技公司的范畴,而另一家中国公司的人工智能实践却是典型的传统企业的创新。2018年,上汽集团成立了安吉人工智能实验室,旨在研究人工智能在工业互联网中的应用。未来汽车将由软件来定义,很多汽车企业都开始了在智能汽车、自动驾驶、智能出行、智能制造、智能物流等方面的布局。上汽成立的这个实验室,承担的就是大脑的作用,目的是形成统一的核心算法能力,包含有模式试点、技术智能、计算智能、感知智能、认知智能等,实现一套算法,赋能多个场景的智能化。根据上汽的初步测算,仅智能制造技术这一块,就可以实现降本增效10%以上。
德勤在《企业人工智能应用现状分析》报告指出,企业对于人工智能的应用场景会不断拓展,在人工智能上的投资会不断加大,据IDC预测,2023年人工智能技术的相关支出将增长至979亿美元,为2019年支出水平的2.5倍以上。成为更加明智的消费者,是多数企业的共识。德勤的报告发现,受访的企业目前更倾向于通过购买而非自研的方式获得AI能力。约50%受访者的购买比重高于自研。许多企业可能会经历一段时间的内部学习和实验才能清楚了解自身所需,然后才会决定是从市场中寻求解决方案还是选择自己研发。
无论是哪种方式的AI能力部署,企业的智能化转型已经是不可逆转的趋势。越早规划,企业的竞争优势将越明显。