—— 中新系全媒体矩阵 ——
科技行业垂直网站近几年人工智能技术得以迅猛发展,这和云计算提供的强大算力和大数据领域多年的积累是分不开的。而就在人人探讨如何打破数据孤岛,“数据中台”已成为大数据领域的一个重要理念之时,腾讯却表示,在打通数据和利用数据方面,数据保护和隐私保护是最需要优先考虑的。
“数据中台的建设目标,是对业务系统和应用开发者提供更加高效、简洁、灵活的数据服务,使得上层建筑不会受限于底层多变的数据格式、数据类型、数据处理和管理逻辑以及复杂的基础架构建设和运维,从而最大限度的释放数据的价值,帮助业务团队及时满足复杂、快速、多变的市场和客户需求。” 在 5 月 21 日召开的腾讯全球数字生态大会上,腾讯云副总裁王龙接受采访时说道,“腾讯从未表示不做数据中台,只是我们认为,并不是一定要把腾讯数据打通并开放使用才是“数据中台”。 腾讯的做法是从客户的真实需求出发,把腾讯积累多年的构建数据服务的一系列工具开放出来,帮助客户构建更加适合自身的数据中台。”
腾讯公司高级执行副总裁、云与智慧产业事业群总裁汤道生也表示,基于扎根消费互联网 20 年,腾讯将会把业界领先的技术和数据中台能力进一步开放,其中技术中台就包括通信中台、AI 中台、安全中台等,数据中台括包括用户中台、内容中台、应用中台等。
在产业互联网时代,数据中台对于企业的业务发展来说,起着更加重要的作用。那么,腾讯如何布局数据中台?如何以数据中台为基础,不断拓展其 AI 发展和应用的边界?腾讯云 AI 下一站又如何布局呢?
腾讯云副总裁 王龙
从数据中台到AI中台
“与数据中台类似,AI 中台也需要为业务系统和应用开发者提供简单、高效、灵活的各种 AI 服务。在这个过程中,数据中台一方面成为 AI 模型训练中非常重要的数据和算力来源;另一方面,AI 推理的结果也能够反馈给数据中台,提升数据中台的服务能力。”
5 月 22 日,在腾讯数字生态大会 AI 专场上王龙称,人工智能已经逐步进入深水区,在很多场景下,需要多种数据、算法和模型联合使用来提升 AI 服务的效果。
早在此前 Analytics Vidhya 发布的一份 2018 人工智能技术总结与 2019 趋势预测报告中,Analytics Vidhya 就曾对人工智能技术在实际场景中的落地进行预测,并表示在 2019 年,计算机视觉等领域对现有方法的改进和增强可能多于创造新方法。
以腾讯云业界领先的刷脸支付和实人实名验证场景为例,就需要使用腾讯优图的 OCR、人脸比对、活体检测等多种人工智能算法来确保核验的效果,有时甚至需要使用更为前沿的唇语检测、声纹识别能力。再加上已经成熟应用多年的大数据风控和安全模型,合作伙伴和客户的业务办理就能得到更强大、更全方位的安全保障。
再以腾讯云在保险行业推出的智能核保解决方案为例,多种 OCR、机器学习和 NLP 算法相结合,就能智能化的处理从客户提交投保材料到产生核保结果的全流程,提升企业运作的效率和终端用户的体验。
AI 模型训练方面也是如此。以已有众多社交、游戏、电商、金融等行业客户的腾讯云 ASR 服务为例,这一来自于微信智聆和微信智言团队的服务,基于多种序列神经网络结构,如 LSTM、AttentionModel、DeepCNN 等,采用 Multitask 混合训练方法,结合 T/S 方式,使得腾讯云 ASR 服务在通用和垂直领域都有行业领先的识别精度。
“AI 中台和数据中台也有显著的差异。要给业务系统和应用开发中提供高效、简单、灵活的 AI 服务,除了要解决传统数据中台遇到的困难,还需要关注另外两个更加复杂的纬度:一是使用的数据常常来自于非手机之外的智能设备,例如各种摄像头、传感器等,其质量和规模受外界环境影响很大,导致 AI 应用效果常常很不稳定,且难以标准化扩展;二是深度神经网络的不可解释性,导致超出预期的数据标注成本、模型优化次数和训练时长,这成为 AI 应用规模化的巨大瓶颈。腾讯推出的云智天枢人工智能服务平台,其目的和使命就是为了解决这些问题。”王龙进一步阐述了 AI 中台和数据中台的定位。
AI中台赋能云边端:腾讯云智天枢架构初探
借助一个平台或者中台,将软件服务中代表成本和效率的标准化,与代表客户体验和业务敏捷度的的定制化做更好的平衡,这是所有新技术的发展趋势。AI中台充分利用数据中台能力的同时,需要更有效的围绕AI来构建智能服务的各层架构,它尝试解决如下的问题:
和数据平台结合,利用其能力作为数据支撑,最大化的发挥数据平台的价值;
高效拆分服务构建环节,智能服务开发流程化,快速响应业务需求;
利用元数据管理方式,提供统一的标准格式,场景可以多人协同配合开发;
基础设施共享化,模型的训练和发布与数据平台有效绑定,服务的构建自动化;
统一的元数据管理系统,模型的全生命周期可管理;
通用AI能力平台化,降低人员要求,提升协作效率。
为此,腾讯凭借着多年的技术和能力积累,将AI能力应用于产业中复杂的多算法融合场景,通过腾讯云智天枢人工智能服务平台(以下简称为“云智天枢”)这一开放、高效的平台服务,不断的输出腾讯的AI中台能力。
在本次大会上,“腾讯云智天枢”也发布了重大更新。针对其诞生背景、设计思路及底层技术实现方式,InfoQ记者也在会后对腾讯云内部该平台的负责人进行了深度对话。
“云智天枢”的架构类似操作系统,既包括各种硬件的驱动程序,也包括各种组件开发、部署、监控和管理工具。在应用架构方面,“云智天枢”从功能模块上分为6大窗口,分别是应用中心、AI工作室、算法仓库、数据中心、设备中心、管理中心。而在技术架构方面,“云智天枢”采用微服务架构和容器化部署,架构层次上采用典型的三层设计,包含网关接入层、逻辑层、存储层。
同时,在此次腾讯全球数字生态大会上,腾讯云副总裁王龙也发布了“云智天枢”的重大更新——可实现10行代码完成一个AI任务的编排与调度,快速构建专属云边端智能应用。
针对于平台内AI任务的编排与调度的实现方式,记者在采访中得知,任务编排的本质是需要实现一个流程引擎的运行DAG图,让流程引擎服务按照图中配置的规则运行整个流程。作为“云智天枢”中的一个重要模块,AI工作室承担AI任务编排的重要工作。在AI任务编排的过程中,使用来自于设备中心、算法仓库、数据中心等多方提供的组件,必然面临不同的组件通信协议不一致的问题,此时,需要平台提供合适的流程引擎来进行适配和驱动。
在任务的调度方面,AI工作室实现了中央调度服务,中央调度服务主要实现两个大方面的功能,即任务调度与容错。中央调度服务的调度策略支持随机调度,轮询调度等。未来会实现按流程引擎服务的负载进行调度,分配任务的时候优先选择负载低的节点,做到全局负载均衡。
而流程引擎服务本身是无状态的,每次运行都会根据中央调度服务无的指令来执行任务。中央调度服务会收集每个流程引擎服务的状态,当发现有服务宕过,会重新把原属于该节点的任务再分配给这个服务。当发现服务是宕掉无法重启或者机器死机,会把属于这个流程引擎服务的所有任务重新调度到其他流程引擎服务。
一个好的流程引擎,需要足够稳定,保证任务在执行过程中不被频繁的打断或重启。但目前常见的问题是,多个任务在同一个引擎上运行,当一个任务在执行中或者出现异常,将导致其他的任务不可用。AI工作室的流程引擎通过对任务进行分组,而非无规则的混合部署,来避免此类问题的产生。按任务分配流程引擎的方式,一个任务独占一个流程引擎的容器,完全规避任务之间的相互影响,从而提升稳定性。
通过基于腾讯云智天枢构建的AI中台,开发者能够简单、快捷的连接和使用腾讯云的各种其他产品、服务和中台能力。AI中台不仅是数据中台在业务上的演进,更是系统服务的重组的过程,而这个“持续智能”的过程正是AI落地的核心思想。
AI落地仍有挑战:AI中台势在必行
现如今,人工智能是解放生产力最直接的手段,也是产业升级必须跨越的“坎”。相比于前两年,人工智能技术的热度已经渐渐趋缓。然而,对企业而言,AI的落地之路仍旧“坎坷”。
腾讯云副总裁王龙在大会现场表示,现如今,AI在产业互联网落地仍面临如下几大挑战:
- 当人工智能与企业生产应用系统深度融合时,如何满足AI激发出的创新诉求所带来的应用多样性?
- 智能设备选型、部署环境,与算法的适配效果息息相关,如何在这三者之间做最高效的集成和适配?
- 企业的真实场景中,已有IT系统和新增的智能设备,尤其是边缘设备众多,导致数据类型差异大,数据清洗、管理和标注工作强度大,如何能够大幅降低成本?
定制化建模成本高,人才匮乏,如何能够真正可行的降低AI建模和调参的门槛?
AI数据和计算越来越多的发生在边缘,如何能更好的和云的基础设施配合,达到更高的利用效率?
对此,王龙认为:“应用场景、资源与基础设施、算法和模型、智能设备、数据质量和规模构成了AI技术落地的五个密不可分的要素。如何将这五大要素实现高效协同,是AI技术在产业界落地中的关键,也是AI中台最重要的任务之一。”
从平台到中台,助力AI技术一步步落地,是一个循序渐进的过程。数据中台和AI中台都应秉持相同的理念,降低新技术应用的门槛,提升各行各业的数字化和信息化水平,助力产业互联网的智能化升级。
“数据中台和AI中台都只是工具,企业需要从自身的市场和业务状况、IT技术能力和人才储备的真实水平出发,以共享服务、整合资源、降低成本、提升效率为目标,在管理文化、组织架构,业务流程等多方配合改进,才能更好的发挥中台的作用,真正提升业务的敏捷度和企业的创新能力。” 王龙最后表示。