UltraLAB GXM让大家能用的起的AI超级异构计算机

2025-05-07 15:09:45

市场上用于深度学习的训练计算机大致情况如下(1)服务器/工作站(支持2、4、8块GPU架构):普遍存在噪音大,无法放置于办公环境,必须聚刁擞蛔放到专门的机房,维护成本高,另外数据存储带宽、延迟、容量也不尽如意。(2)分布式集群架构:性能强大,但是开发成本太高,是大多数科研单位无法承受。(3)大部分GPU计算机(服务器/工作站),重点都放在GPU卡数量上,似乎只要配上足够GPU卡,就可以了。然而,机器硬件配置还需要整体均衡,不同的学习框架更需要不同GPU卡去适配。针对目前深度学习应用计算特点,UltraLAB图灵工作站再添新成员--GX480M和GX610M。

UltraLAB GXM让大家能用的起的AI超级异构计算机

工具/原料

深度学习所需的软件

UltraLAB GXM图灵工作站

深度神经网络计算特点与硬件配置分析

1、数倌栗受绽据存储要求:做深度学习首先需要一个好的存储系统,将历史资料保存起来。主要任务:历史数据存储,如:文字、图像、声音、视频、数据字羿岚寺库等。。。性能要求:a.数据容量:提供足够高的存储能力b.读写带宽:多硬盘并行读写架构提高数据读写带宽c.接口:高带宽,同时延迟低传统解决方式:专门的存储服务器,借助万兆端口访问缺点:带宽不高,对深度学习的数据读取过程时间长(延迟大,两台机器之间数据交换),成本高UltraLAB解决方案:将并行存储直接通过PCIe接口,提供最大16个硬盘的并行读取,数据量大并行读取要求高,无论是总线还是硬盘并行带宽,都得到加大提升,满足海量数据密集io请求和计算需要

2、CPU要求:CPU的主要任务(1)数据从秽颢擤崮存储系统调入到内存的解压计算(2)GPU计算前的数据预处理(3)运行在代码中写入并读取变量执行指令,如函数调用启动在GPU上函数调用,创建小批量数据启动到GPU的数据传输(4)GPU多卡并行计算前,每个核负责一块卡的所需要的数据并行切分处理和控制(5)求解后数据保存前的压缩计算 上述每一类操作基本都是单核计算模式, 如果要加速这些过程,唯有提升CPU频率 传统解决方式:CPU规格很随意,核数和频率没有任何要求UltraLAB合理推荐:a.CPU频率:越高越好b.CPU三级缓存:越大越好c.CPU核数:比GPU卡数量大(原则:1核对应1卡,核数要有至少2个冗余)

3、GPU要求:主要任务:承担深度学习的数据建模计算、运行复杂算法传统架构:提供1~8块GPUUltra讣嘬铮篌LAB合理推荐:a.数据带宽:PCIe8x 3.0以上b.数据容量:显存大小也很关键c.计算匹配:CPU核-GPU卡 1对1d.GPU卡加速:多卡提升并行处理效率

4、内存要求主要任务:存放预处理的数据,待GPU读取处理,中间结果存放UltraLAB合理推荐:a.数据带宽最大化:单Xeon E5v4 4通道内存,双Xeon E5v4 8通道内存,内存带宽最大化 b.内存容量合理化:大于GPU总显存

UltraLAB GXM图灵计算工作站介绍与配置推荐

1、目前提供两种机型:GX480M和GX610M

UltraLAB GXM让大家能用的起的AI超级异构计算机
UltraLAB GXM让大家能用的起的AI超级异构计算机

2、GX480M技术规格一览表

UltraLAB GXM让大家能用的起的AI超级异构计算机
UltraLAB GXM让大家能用的起的AI超级异构计算机

3、GX610M技术规格一览表

UltraLAB GXM让大家能用的起的AI超级异构计算机
UltraLAB GXM让大家能用的起的AI超级异构计算机
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢