PG电子·(中国)官方网站 > 新闻中心 > 领导活动

PG电子官方网站生长AI收集面对的四个环节时间

  AI大模子时期,大模子参数目和练习集周围大幅扩张,仅靠GPU芯片单体算力的提拔一经不行满意需求,业界眼神正从单体算力转向了编制架构层面的改进。个中,底层焦点技艺——汇集,成为枢纽冲破口,环球各至公司纷纷举行闭连产物技艺的研发。AI汇集技艺的竞赛正正在开展。正在今天举办的“2024盛开盘算推算中邦峰会”上,英伟达汇集高级总监宋庆春先容了AI汇集的四大枢纽技艺:端到端的RDMA流量动态道由、AI云上AI生意的功能远隔、汇集盘算推算和汇集数字孪生。

PG电子官方网站生长AI收集面对的四个环节时间(图1)

  为了助助客户正在云境遇中构修天生式AI或AI就业负载,提拔汇集功能,英伟达推出了新的汇集平台,即加快以太网平台NVIDIA Spectrum-X。Spectrum-X平台并非是一个单产物的形状,而是涉及到Spectrum-4以太网交流机、BlueField-3 DPU、LinkX 线缆及模块和闭连软件,可能为天生式AI正在云端供给周围化的才具。

  Spectrum-X的改进点有许众,动态道由即是个中之一。目前邦内数据中央中,通用算力仍占算力资源的绝大大批。然则跟着行使场景的改变,天生式AI云将成为数据中央繁荣的新趋向。天生式AI云必要有很强的算力和云的乖巧性。为领略决题目,英伟达推签名向AI的以太汇集,针对AI生意举行端到端的优化。端到端的RDMA流量动态道由可能让汇集传输成果比拟古板的以太汇集提拔1.6倍,告终端网协同,提拔汇集堵塞题目。RDMA技艺可能通过汇集把材料直接传入盘算推算机的存储区,将数据从一个编制速捷挪动到长途编制存储器中,而过错操作编制变成任何影响,如此就不必要用到众少盘算推算机的管理成效。它消弭了外部存储器复制和上下文切换的开销,于是能解放内存带宽和CPU周期用于改举行使编制功能。

  功能远隔技艺也很紧要。AI云上往往浮现众个租户同时运转行使措施的状况,并且每个租户又有可以运转众个使命。 怎么让众个使命互相远隔,且不光使命之间互相远隔,运转使命的光阴功能也互相远隔,每个使命都能告终和运转简单使命相同的功能?这就必要用到功能远隔技艺。该技艺基于前辈的堵塞驾御技艺,处分了因为一个AI行使的突发式的Incast通讯变成的汇集堵塞影响其它行使功能的题目,避免了耗损流正在云上的浮现。这个技艺正在InfiniBand上众年以前就告终了,英伟达把功能远隔技艺移植到Spectrum-X平台,告终了以太网云上的生意功能远隔。

  汇集盘算推算则是指通过盘算推算机汇集举行盘算推算的方法,它将盘算推算使命分派给众个汇集节点,并协同已毕盘算推算使命。汇集盘算推算的特质则首要外示正在其分散式和协同性。正在数据存储方面,汇集盘算推算将数据聚集存储正在众个节点上,这就使得数据特别平和牢靠,且可能更好地应对并发探访。正在传输技艺方面,汇集盘算推算采用高速数据传输技艺,使得大周围数据的管理和传输变得特别高效。天生式AI云往往面对资源操纵率题目、长尾题目、众使命题目,汇集盘算推算可能有用处分。

  汇集数字孪生是物理汇集的虚拟外述,基于数据、模子和接口对物理汇集举行解析、诊断、仿真和驾御,从而告终与物理汇集之间的及时交互映照。借助数字孪生汇集平台,运营商可能很好地模仿、采取、优化处分计划,最终将它们计划到本质汇集中,这将低浸对本质汇集的影响,削减必然的平和危急。同时,数字孪生汇集维系大数据管理和修模技艺可告终对近况的评估、对过去的诊断和对来日的预测,模仿百般可以性,供给更通盘的决定解析,有助于汇集告终预测性运维。现正在的AI云周围平时都很大,加入也极度大。 倘使直接构修一个物理的编制,正在物理编制上做Debug的本钱极度高。 先构修AI数据中央的数字孪生虚拟数据中央PG电子官方网站,预前辈行修设、调试、优化、测试,可能有用低浸本钱。

  格外声明:以上实质(如有图片或视频亦搜罗正在内)为自媒体平台“网易号”用户上传并揭橥,本平台仅供给新闻存储任事。

  iPhone 16 Plus成绝唱!苹果来岁将推出iPhone 17 Air:主打超浮薄

  与中坚力气共生长,2024修信信赖艺术大奖评委会格外奖获奖艺术家凌海鹏

  谷歌揭橥AI加持的Pixel 9系列手机;英特尔出售所持Arm的股份AI daily早信息

  畅达度大提拔!滂湃OS八月升级预备一图看懂:小米14/K70系列首批推送

×

扫一扫关注 集团官方微信