12月
04日
AWS发布新一代AI芯片Trainium3及Trainium2云实例:加速大模型训练部署
牛透社12月4日消息,AWS在AWS re:Invent 2024 大会上宣布,其新一代AI训练芯片Trainium3及基于Trainium2芯片的云实例现已全面可用。Trainium2实例提供30-40%的性价比提升,单个实例包含16颗Trainium2芯片,可提供20.8 petaflops的峰值算力,适合训练和部署具有数十亿参数的大型语言模型(LLM)。此外,AWS还推出了Trn2 UltraServer,集成64颗Trainium2芯片,通过NeuronLink互连技术,算力峰值可达83.2 petaflops,能够训练和部署全球最大规模的模型。
AWS还计划与AI模型企业Anthropic合作,构建名为Project Rainier的EC2 UltraCluster巨型计算集群,该集群将包含数十万颗Trainium2芯片,整体算力是Anthropic目前用于训练最先进模型所需量的5倍以上,有望成为全球最大的AI计算集群。