由于操作过于频繁,请点击下方按钮进行验证!

强强联手,惠普 Z 系列助力 Autodesk CONVERGE CHINA 2023 创造无限可能 !

国际金属加工网 2023年09月05日

9 月 22 日,欧特克公司将于深圳召开「Autodesk Converge 2023 高峰会议」。惠普 Z 系列作为欧特克软件长久以来的合作伙伴赞助讲继续支持本次大会,强强联手帮助高维创新者创造无限可能。更多信息请关注「惠普 Z Club」实时更新。

目前,真正应用的大部分自动驾驶汽车大多数停留在 L2——部分自动驾驶阶段,要想达到有条件自动驾驶的 L3 级别甚至更高等级,需要通过不断地进行深度学习、强化学习及多模态大模型训练来获得感知能力、决策能力及主车智能等技能进行提升。

在自动驾驶技术研究与开发的过程中最关键的要素之一就是算力支持,而传统的数据算力早已跟不上目前庞大的算力需求,自动驾驶技术的 PK 也演变为算力的 PK。尤其是在模型训练的时候,一台强力的 GPU 工作站将会为研发工作带来诸多便利。

上海人工智能实验室 OpenDriveLab 自动驾驶团队使用惠普 Z 系列 HP Z8 Fury G5 数据科学工作站,基于自动驾驶算法训练的场景进行了完整的开发训练实验,下文将详细对模型训练、实验环境以及测试过程中的使用体验进行全面总结。  

微信图片_20230905085818.jpg

PART.1关键参数及散热表现

  • CPU:Intel® Xeon® W7-3465X 2.5GHz 28cores 300w

  • GPU:4*NVIDIA® RTX™ A6000 48GB

CPU 为 23 年一季度最新发布的 Intel® Xeon® W7 处理器,最高可睿频至 4.8GHz;GPU 配置4张 NVIDIA® RTX™ A6000 显卡,共计 192GB 显存,可以满足大多数中小模型任务。由于整机计算性能强大,散热成为一大挑战。惠普 Z 系列 HP Z8 Fury G5 数据科学工作站为处理器和每张显卡都配备了高压散热风扇,在机器前部和底部设置进风口,并将热风从尾部排出。

在实际测试中,出风口温度始终保持在一个较低的区间,同时风扇运行的噪声较小,几乎可以忽略不计(即使是在满载运行时)。

PART.2在自动驾驶算法中的表现

01 模型介绍

UniAD(英文:Planning-oriented Autonomous Driving;简称 UniAD)是由 OpenDriveLab 主导的研究工作,在 2023 年 CVPR 会议上获得了最佳论文奖项。这是近十年来计算机视觉三大顶级会议(CVPR、ICCV、ECCV)第一篇来自中国研究机构(包括港澳台地区)的最佳论文奖。同时,这是 CVPR 历史上第一篇以自动驾驶为主题的最佳论文。

微信图片_20230905085818_1.jpg

该文章提出一个端到端的感知决策一体框架,融合了多任务联合学习的新范式,使得进行更有效的信息交换,协调感知预测决策,以进一步提升路径规划能力,是业界首个具备全栈关键任务的端到端自动驾驶模型。

微信图片_20230905085819.jpg

UniAD 首次将感知、预测、规划等三大类主任务、六小类子任务(目标检测、目标跟踪、场景建图、轨迹预测、栅格预测和路径规划)整合到统一的端到端网络框架下,实现了全栈关键任务驾驶通用模型。在 nuScenes 真实场景数据集下,所有任务均达到领域最佳性能(State-of-the-art),尤其是预测和规划效果远超之前最好方案。项目地址:(暂不可见)/OpenDriveLab/UniAD

02测评介绍

(1)使用场景:端到端自动驾驶算法模型训练

(2)测评任务:UniAD 模型的训练表现

(3)实验环境:torch 1.9.1+cu111

训练UniAD模型(官方配置为8张NVIDIA®A100),分为两个阶段:第一个阶段,占用 50G 显存,花费两天时间训练 6 个 epochs,相当于 1 个 epoch 花费 8 小时;第二个阶段,占用 17G 显存,花费 4 天时间训练 20 个 epochs,相当于 1 个 epoch 花费 4.8 小时。

考虑到显存大小,我们将 quene_length 由 5 改为2,使得 UniAD 模型能在4 张NVIDIA®RTX™A6000显卡上运行。实验结果表明,在 4 张 NVIDIA® RTX™ A6000 显卡上进行第一阶段训练需要占用 48GB 显存,一个 epoch 用时 15 小时。考虑到工作站的显卡数量相较官方更少,单 epoch 时间延长也在可接受范围之内。

同时,可以观察到训练过程极其稳定,机器运行噪音小,在使用其他操作时也十分流畅,从各方面证明了这台惠普 Z 系列 HP Z8 Fury G5 数据科学工作站的性能十分强大。

微信图片_20230905085820.jpg

在保持训练的同时对一个 checkpoint 的结果进行可视化,能够流畅生成结果。

微信图片_20230905085820_1.jpg

(图:可视化展示结果) 

PART.3个人体验与对比

OpenDriveLab 同时拥有公有云集群的使用权,配置 2000 多张 NVIDIA®A100 显卡,那么使用惠普Z系列数据科学工作站相比于使用集群有什么优势呢?我认为主要体现在以下几个方面:

一,集群服务器没有可视化界面,需要可视化结果(比如使用 open3d 可视化点云)时,需要将结果下载至个人主机,比较麻烦,而惠普 Z 系列数据科学工作站可以直接连接显示器;二,使用集群常常需要重新配置环境、配置网络,而本地环境配置完毕一劳永逸。同时,虽然集群服务器性能更强大,但是中小型的模型训练使用惠普 Z 系列数据科学工作站完全能够胜任;三,使用集群有时会出现启动慢、网络卡顿、结点掉线等问题,影响工作进度,而惠普 Z 系列数据科学工作站则非常稳定

微信图片_20230905085820_2.jpg

PART.4总结

总结整个实验过程,惠普 Z 系列 HP Z8 Fury G5 数据科学工作站配备 4 块 NVIDIA® RTX™ A6000 48GB 显卡,在训练任务中基本不用担心显存不足的问题。通常 batch 的设置不会太大,常用的设置为 32、64 和 128,共计 192GB 的显存在为模型训练提供了稳定性和增大 batch 的可能性(随着 batch 的增大,模型的性能可能会下降,虽然 batch 的增大能在一定程度上提高模型的泛化能力和稳定性)。

同时,惠普 Z 系列 HP Z8 Fury G5 数据科学工作站具备极高性能的 CPU ——Intel® Xeon® W7,非常适合多线程任务并行。实际使用中可以发现,工作站在解压等对 CPU 要求较高的任务上表现出色,对 nuScenes 数据集的解压速度能够达到 300MB/s

最后,惠普 Z 系列 HP Z8 Fury G5 数据科学工作站还配备 2T 的存储空间,能够轻松放下自动驾驶领域的大型数据集,如有需要还可供多个用户使用。得益于惠普Z系列高效的散热解决方案和冷却设计,工作站即使在满载运行情况下也没有产生很大的热量,风扇噪音也在可接受的范围之内。

惠普 Z 系列 HP Z8 Fury G5 数据科学工作站为自动驾驶研发测试过程中,为专业软件和系统平台提供更好的兼容性和稳定性。在处理器、显卡以及软件系统长时间高负载工作环境下也能保持流畅的运行处理状态,确保自动驾驶算法训练任务高效、稳定的完成,是一台综合性能十分优异的工作站。

微信图片_20230905085821.jpg

点击“阅读原文”,立即注册参会,共襄年度盛举。

(欧特克Autodesk)

声明:本网站所收集的部分公开资料来源于互联网,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。如果您发现网站上所用视频、图片、文字如涉及作品版权问题,请第一时间告知,我们将根据您提供的证明材料确认版权并按国家标准支付稿酬或立即删除内容,以保证您的权益!联系电话:010-58612588 或 Email:editor@mmsonline.com.cn。

网友评论 匿名:

分享到

相关主题