7项冠军,这是浪潮信息在MLPerf™ V1.1 AI训练评测中交出的最新成绩单。
(来源:资料图)
在MLPerf™ 2021年度的4次性能测试中,浪潮AI服务器获得44项第一。其中,在数据中心AI推理场景的总32项任务中获得17项冠军,在边缘AI推理场景的总31项任务中收获16项冠军,在单机AI训练场景的16项任务中斩获11项冠军。
MLPerf™M是世界上影响力最大的国际AI性能基准评测,由图灵奖得主大卫•帕特森(David Patterson)发起,谷歌、Facebook、英伟达、英特尔、浪潮信息、哈佛大学、斯坦福大学、加州大学伯克利分校等50余家全球AI领军机构共同组成的MLCommons推动,并致力于推进机器学习和人工智能标准及衡量指标。
MLPerf™基准测试场景在实际应用中均会被频繁用起,用户可以根据相应测试结果,来获悉服务商在AI上的真正实力。 本次浪潮信息以上述成绩摘得MLPerf™桂冠,或是促进AI行业新一轮爆发的“引信”。
当前,AI正在反哺开发者,使用Codex等AI辅助编程工具的开发者越来越多,而使用低代码进行开发的人员占比也越来越高,同时这类低代码平台或辅助平台也正在进化。之前平台背后对应的是某种编程语言,现在平台背后则由AI进行加持。一旦AI彻底改变系统的开发模式,研发门槛得到降低,那么AI必将迎来新一轮爆发。
(来源:资料图)
纵观近年来在AI领域取得良好成绩的各类模型,其参数规模基本按照指数级增长,从谷歌T5破百亿开始到GPT-3破千亿用了近2年。
而GPT-3到浪潮人工智能研究院的“源1.0”2457亿参数只用了一年的时间,模型越大效果越好的大力出奇迹现象也正在成为业内铁律,比如在对“源1.0”大模型进行图灵测试时,将人类专家创作的新闻、诗歌、对联,小说续写等类作品混杂在由源1.0的作品中,由测试者判断该作品是否优秀并把优秀作品判定为人类创作,最后的测试结果“令人振奋”,在源1.0的挑战测试中,人们能够准确分辨人与“源1.0”作品差别的总体成功率低于50%。
这意味着,多数人不能辨别作品出自文学大师之手还是由源1.0创作,可以说“源”系列大模型正在朝着更高的人工智能水平迈进,这一切的背景是强大的AI数据处理能力与AI算力平台支撑。
(来源:资料图)
浪潮AI服务器,让业界轻松拥抱超大数据
本次浪潮信息能够夺冠,该公司的AI旗舰服务器NF5488A5和NF5688M6功不可没。据悉,NF5488A5是全球首批上市的A100服务器,在4U空间支持8颗第三代NVLink互联的A100 GPU和2颗AMD Milan CPU,同时支持液冷和风冷散热技术。NF5688M6是面向大规模数据中心优化设计的具备极致扩展能力的AI服务器,支持8颗A100 GPU和两颗Intel Ice Lake CPU,支持多达13张PCIe Gen4的IO扩展卡。
对比当下AI开发和十几年前的不同,就会发现当前AI开发者面临的数据越来越多,且正以三年翻两番的速度爆炸式增长。但是数据的快速增长却成了AI开发者们的“甜蜜负担”,想玩转越来越大的模型真是愈发困难,发挥数据价值需要强大算力引擎的支持,只有浪潮AI服务器的数据处理性能越来越强,数据作为当下的“原油”才能更好地发光发热。
很多人都知道,智慧交通、智慧医疗、智能驾驶等场景涉及到大量数据,但对于具体的数据量级却没有直观感受,姑且以对数据处理时效要求最高的自动驾驶场景为例:前不久特斯拉宣布旗下自动驾驶系统FSD Beta9.0即将完成,有消息称最新版本的FSD自动驾驶系统能力要达到L5级。
这则消息令人颇感意外,因为目前特斯拉的AutoPilot也就是L3的程度。L5级别的自动驾驶,尽管不是从0到1的开创性工作,但在实践上想真正实现全天候自动驾驶的难度极大。 公开资料显示,一台自动驾驶测试车辆每天至少产生10T数据,平均每分钟要处理几百M数据。
因此,自动驾驶的决策延时必须保持在极低状态,当汽车的行驶速度为80公里/小时,其机械制动距离就会接近30米。要想确保安全,这时留给自动驾驶的反应时间通常只有0.1秒,而且任何一点决策失误都有可能造成极其严重的后果。 直观地说,L5级别的自动驾驶是一个每秒数据处理能力要达一个G,数据处理延时必须低于0.1s,可靠性必须高于99.999999%,再考虑AI模型的上百亿个参数,这对硬件数据处理能力的要求之高简直令人咋舌。
在其他场景下,数据处理能力不足最多只需多算些时间,但是在智能驾驶、自动飞行等场景慢哪怕0.1秒都可能付出生命的代价。目前的AI领域就是一力降十会,而浪潮AI服务器通过MLPerf™测试,证明它是大规模AI模型落地的绝佳选择。
全栈式平台,让AI真正成为“日用品”
当然,只拥有强大的AI数据处理能力,还不足以应对复杂的AI应用场景,更无法在激烈的MLPerf™中取得好成绩。因为随着数据的生根发芽,AI的应用领域也在不断拓展。但是AI爆发的前提还是要以全方位、无短板的AI计算能力为前提。
这方面MLPerf™测试与实际应用贴合很紧密,从图像分类(ResNet)、医学影像分割(U-Net3D)、目标物体检测(SSD)、目标物体检测(Mask R-CNN)、语音识别(RNNT)、自然语言理解(BERT)、智能推荐(DLRM)以及强化学习(MiniGo)等8大方面均有涵盖。
概括来说,没有实现数据处理、模型训练、AI推理的一体化&全栈式的AI平台,根本就无法取得好成绩,也无法真正让AI大规模应用落地。因为木桶效应的制约,会让AI在落地过程中付出无法承受的时间成本。如果说数据处理能力是AI领域的入场门票,那么全栈式AI算力平台就是顶级选手所必须要修炼的内功心法,而全栈式AI能力是浪潮信息一直在布局谋划的大平台。
2015年,该公司就对AI加速芯片进行研发,推出了集成FPGA加速卡的F37X;平台方面则布局AI开发平台AIStation、OpenStack AI云平台、自动机器学习平台AutoML Suite,在计算框架方面,开源发布基于FPGA的高效AI计算框架TF2,并在当年开源了集群并行版Caffe深度学习计算框架Caffe-MPI。
近期,浪潮人工智能研究院又发布全球最大中文巨量模型“源”,并以开源开放普惠产学研各界,共促AI大模型创新发展与产业落地。 而MLPerf™的洗礼,证明浪潮信息可以提供全方位、无短板的AI计算支持。其能力覆盖应用场景洞察与系统方案设计、应用代码移植优化、计算加速部件性能横向评测等各个环节。填补了AI领域各技术栈之间的缝隙,也提升了数据分析的处理时效。
让业界可以轻松获取最强的AI算力,使AI产生更多价值。 此外,全栈式产品也让浪潮信息的AI生态变得顺理成章。浪潮发起“元脑生态计划”,连接技术端的人工智能算法公司和应用端的ISV、SI公司,通过伙伴间的能力融合,促进智算创新技术、场景应用与交付服务的融合落地。
长期的研发积累与生态合作,让浪潮信息在智能视频分析、医疗影像、电力设备巡检、语音识别、智能交通等等方面形成了端到端的全栈式解决方案,至此它已是一个拥有全栈式AI能力的顶级厂商之一。
总结来看,AI平台是未来各行业数字化、智能化转型的关键,浪潮信息的本次夺冠,预示着浪潮的AI生态已经渐成闭环,让AI真正产生价值,造福于整个社会。
本文出自快速备案,转载时请注明出处及相应链接。