10月
08日
中国电信人工智能研究院炼成万亿参数大模型
牛透社10月8日消息,近日,中国电信人工智能研究院宣布完成国内首个纯国产万卡集群上的万亿参数大模型训练,并正式开源了基于该集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型TeleChat2-115B。这一成果由中国电信集团CTO、TeleAI院长李学龙教授团队完成,标志着国产大模型训练进入全国产自主创新、安全可控的新阶段。
TeleChat2-115B模型在训练过程中,采用了多种优化手段来提升效率和稳定性,实现了与GPU同等算力的93%计算效率,训练有效时长占比超过98%。该模型在多项权威评测中表现卓越,特别是在工具使用、逻辑推理、数学计算等方面能力显著提升。
开源地址包括GitHub、Gitee、Modelscope和Modelers等平台,为开发者和研究者提供了丰富的资源。TeleAI通过开源模式积极推动技术创新,加速大模型技术的产业化应用。