至强6新品以最优TCO开释AI潜能,从云到边无忧安
作者: [db:作者] 点击次数: 发布时间: 2025-02-28 09:03
飞象原创(魏德龄/文)拥抱AI,将现有营业与新技巧相融会,是现在正在被浩繁企业所存眷的话题。但如团体用户在安排当地AI时,可能会斟酌内存与算力怎样与相干年夜言语模子所婚配的成绩相似,企业在本身才能基本上须要做出更多考量,怎样把持动力的耗费,取得最优的投入产出,才干罢黜安排疑虑,在软硬件的更新换代中实现AI融会。克日,英特尔扩大了至强6产物组合,带来面向通用效劳器负载的至强6700/6500P系列(Granite Rapids-SP)跟面向收集跟边沿利用的至强6 SoC(Granite Rapids-D)。两款产物均针对AI需要供给了专门的技巧支撑。此中至强6700/6500P系列中初次支撑的MRDIMM技巧,让CPU实现了对AI更好的支撑。首款支撑MRDIMM的平台至强6700/6500P系列的目的是更好地效劳传统企业种种差别的普遍利用,包含最新的AI利用、传统的数据库或许是边沿、存储或差别的传统盘算。在AI任务负载需要日益加强的情形下,更快的内存带宽能够让CPU更好地支撑AI。起因在于局部任务负载,如推举体系中的某些义务,依然依附CPU处置且对内存带宽极为敏感。

英特尔在多年从前便开端与浩繁厂商停止MRDIMM技巧的推动。在此次宣布的至强6产物中,比拟内存速率在4800-5600MT/s的第五代至强,至强6的速率曾经晋升到了DDR5 6400MT/s。MRDIMM更能够把这个速度年夜幅晋升到8800MT/s。比拟于现已在市道上安排的数据核心效劳器,晋升到达50%以上。MRDIMM能够在第一时光年夜幅度晋升内存带宽,可能为中小模子推理义务供给更好的性价比。MRDIMM与至强6的联合,以及与其余减速卡的搭配,将明显晋升端到端营业的机能。

比方对小范围的年夜言语模子而言,其推理进程不只在天生首个Token时须要停止麋集的盘算,更主要的是,在后续的年夜少数Token推理中,对内存带宽的需要十分高。因而,至强6处置器与MRDIMM技巧的联合能够带来更佳表示。“咱们的最新超等盘算机将装备英特尔至强6处置器,采取P核,这是最新的处置器技巧,并联合高带宽MRDIMM内存。它将为用户供给明显减速处理特定受内存限度义务的才能,这对迷信研讨至关主要。”IT4Innovations超等盘算效劳总监Jansik表现。同时,至强6平台上还完全地支撑了业界尺度CXL 2.0。此中一个凸起的利用场景就是怎样经由过程CXL2.0扩大内存,来以更高的性价比去拓展效劳器的内存空间,进而满意包含AI在内对内存总量敏感的利用场景需要。消除安排后顾之忧英特尔至强6700/6500机能核处置器可能供给杰出的机能与能效均衡。与上一代产物比拟,至强6处置器在普遍的企业任务负载中实现了均匀1.4倍的机能晋升。作为AI体系的机头节点CPU,至强6可与GPU搭配,为客户供给优选组合。