2020年一开局,新冠病毒就给全球一个“暴击”,所有人都不得不面对这场危机。
但危机也意味“危中有机”。
在线会议迎来了爆发,仅钉钉一个平台,全国超过2亿人实现了在线办公,1.2亿学生在线上课。
互联网技术二十年的发展,让这些数字不足为奇。
但是恐怕不会有太多人注意到, 疫情的爆发也让AI技术浮出水面,乃至悄然渗透到我们日常生活的角落:
AI医疗用于核酸检测、肺部CT检查;机器人技术保证疫情期间的生产得以继续进行;人脸检测用于跟踪和防控病毒传播。
在这一切看得见的技术之下,还有更多看不见的基建设施在背后提供。仅AI医疗影像每天要处理上万张CT图像,需要服务器进行大量的训练和推理运算。
如果没有强大的算力资源作后盾,AI技术也只是“巧妇难为无米之炊”。
因此,国家在3月提出了新基建:加快5G网络、数据中心等新型基础设施建设进度。
谁来提供巨大的算力需求?
在4月9日浪潮2020年云数据中心合作伙伴大会(IPF2020)上,浪潮发表了对于未来数据中心演进趋势的独到见解
智算中心,为AI时代“发电”
大会一开始,浪潮集团执行总裁、首席科学家王恩东便以电力为比喻,告诉我们算力在AI时代的基础地位。
工业时代,电力是推动社会进步的基础,而算力则是我们这个AI时代的电力。
拥有业内最强最全面的AI计算产品系列的浪潮自然冲在提升算力的第一线。
增加发电量可以堆砌燃料,但提升算力可不仅仅靠堆砌硬件。
在王恩东看来,围绕算力要在四个关键作业环节做出创新:生产算力、聚合算力、调度算力、释放算力。
生产算力就是要以硬件为基础,不能仅仅靠硬件,但没有强大的硬件却万万不可能。
近年来,浪潮推出了多款强大的AI算力机组:AGX-5是目前全球最高性能的AI计算主机之一,AGX-2是目前单位空间内GPU计算密度最高的服务器,MX1是全球首个可支持多家不同型号AI芯片的AI开放加速系统。
有了强大的硬件设备,就能训练更强的AI模型。
借助浪潮的超大规模AI计算框架LMS,浪潮首先实现了70亿参数自然语言处理模型的训练,相比主流的BERT模型参数量提升了20倍。
在提升单机的计算能力后,浪潮依托数据中心来聚合算力。
比如,浪潮NX20智能网络加速产品可以打造更高效率更低延迟的云中心,而针对高并发推理集群,浪潮通过构建高性能存储池和深度优化软件栈,吞吐能力提升3.5倍以上。
全面升级的浪潮AI软件
如果说这生产算力和聚合算力相当于制造发电机和并网发电,那么调度算力和释放算力就是把电力以最高效的方式输送到最需要的地方,更需要在软件上优化。
正因如此,硬件厂商的浪潮近年来在AI软件方面也有大量投入,甚至软件开发人员数量已经超过硬件。
对客户而言,要在有限的硬件成本上充分利用算力,唯有在软件上的提升,才能实现AI算力的释放。
浪潮AI&HPC总经理刘军认为:
要生产算力,光有非常好的硬件实际上还是不够的,如何把更大规模的计算挑战在当前的硬件平台上实现,我们还需要有非常强大的软件优化产品和技术,使得我们充分释放AI计算的算力。
所以,浪潮早在2017年就推出了深度学习训练平台AIStation。
AIStation支持多种深度学习框架,可以快速部署深度学习训练环境,管理深度学习训练任务,实现对硬件算力的管理和调配。提高计算资源的利用率和生产率,为深度学习用户提供高效易用的平台。
今年的IPF上,浪潮又重磅发布了AIStation推理平台,全面支持训练与推理两大环节,将AI计算的另一块拼图补上,成为业界功能最全的AI管理平台。
这一次的全新升级AIStation资源平台全面支持训练与推理两大环节,实现从模型开发、训练、部署、测试、发布、服务的全流程一站式高效交付,为企业用户提供更全面的服务。
平台已经搭建完成。万事俱备,只欠东风。开发技术可能又是横在企业面前的一道难题。
为了解决传统企业在AI落地上面临的技术能力不足、人员匮乏的情况。
浪潮发现在面对AI客户时,这些企业最大的问题是缺乏专家,很难花费大量的人力物力去开发AI应用,
而AutoML是现在AI民主化的一个极有前景的研究方向。不需要太多AI专业知识,即可根据需求自动开发模型。
浪潮将这一些列软件打包为AutoML套件(AutoML Suite),能够从海量的数据里面,自动产生跟AI相关的高技术模型,降低了企业使用AI的门槛。
AutoML Suite中包含自动搜索网络的AutoNAS、自动调参的AutoTune和自动压缩剪枝的AutoPrune,解决了从开发设计到训练再到部署过程中的每个难点。
同时AutoML Suite还能保证在用户开发时数据的隐私保密性,又解决了企业在考虑上云时存在的担忧。
而有了浪潮的这两件工具,过去需要几个专家开发数月的模型,现在可能只需一两人在几天内完成开发,过去需要数天才能部署到设备的模型,现在只需几分钟。
在AI算力四大作业环节的加持下,智算中心已可以对外提供一站式AI算力高效供应。
浪潮认为,智算中心将成为新基建,为AI产业提供动力,它需要满足开放标准、集约高效和普适普惠三个必要条件。
开放标准,要求智算中心从硬件到软件、从芯片到架构、从建设模式到应用服务都应该是开放的、标准的;集约高效,要求智算中心的建设要有超大规模,要采用领先的技术,保证自身的先进性;普适普惠,则要求智算中心发挥基础设施的社会价值,服务大众。
在王恩东看来,虽然对于普通人来说,智算中心看不见摸不着,但它就在那里,源源不断产生智慧时代的动力。智算中心,就是我们这个时代的动力源。
评论