阿里云缘何在大模型开源这条路上越走越远?|牛透快评
-
2023-12-07
刘佳庆
最近,阿里云举办通义千问发布会,开源通义千问720亿参数模型Qwen-72B。此外,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。至此,通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。
阿里云CTO周靖人表示,开源生态对促进中国大模型的技术进步与应用落地至关重要,通义千问将持续投入开源,希望成为“AI时代最开放的大模型”,与伙伴们共同促进大模型生态建设。
开源并不是一个新鲜的话题,在科技界,开源和闭源两种路线之争已存在多年。例如,PC端和服务器操作系统有开源的Linux和闭源的Windows、移动操作系统则也有开源的Android和闭源的iOS。如今,炙手可热的大模型也不例外。
在国外,开源大模型Meta的Llama2已成为闭源大模型OpenAI的GPT-4的有力竞争者。在国内,智谱AI、百川智能等创业企业均研发了开源大模型,如今随着阿里云大模型积极拥抱开源路线,他们成为了目前唯一选择开源路线的大厂,将走出一条与腾讯云、百度智能云等不同的发展道路。
对于大模型的开源和闭源,两条路线都有各自的支持者。
开源的粉丝认为,不同于此前的开源软件,开源可以加速大模型的迭代升级,会为用户提供一整套技术服务,简化用户模型训练和部署的过程,用户只需要经过微调,就能够快速构建高质量的模型。而且,开源还能够带动众多的开发者共同实现生态繁荣。
而闭源的拥趸则觉得,闭源的优势在于大模型产品源自很强的研发团队,产品相对更成熟和稳定,用户体验也会更好,在安全方面,闭源路线还能够更好地保护企业的核心技术和数据资产,同时可以提供更加专业的技术支持和服务。
两种路线纷争,各有各的理由。牛透社认为,大模型的种种未知和不确定性,衍生出了开源与闭源两种模式,二者孰优孰劣,现在下结论还为时过早,但它们不应该是对立关系,它们都是大模型这一新生事物在发展的初级阶段所需要的不同探索和尝试,两种路线会像Linux、Windows、Android、iOS一样长期存在,相辅相成、优势互补、共同发力,早日让大模型找到成熟的商业模式,成为“水电煤”一样不可或缺的新基础设施。
而对于阿里云大模型的开源,在牛透社看来,今年以来动作频频,广受外界关注的阿里云,他们选择大模型的开源路线是必然的。接下来,我们就分析一下阿里云坚定支持大模型开源的原因、思考和逻辑。
首先,阿里云大模型的开源,与他们的“开放”策略直接相关。在近期举办的云栖大会上,阿里强调最多的关键词就是“开放”。按照阿里巴巴集团董事会主席蔡崇信的话说,今天,随着大模型技术的迅速发展,智能化时代正在开启。阿里云正在面向AI时代进行全面技术升级和创新,打造“AI时代一朵最开放的云。”
而在2023年世界互联网大会乌镇峰会上,阿里巴巴集团CEO吴泳铭则提出了阿里的最新定位:AI时代,阿里巴巴要成为一家服务全社会AI创新的、开放的“科技平台企业”。在这一新定位下,阿里将坚持做好两件事,“一是提供稳定高效的AI基础服务体系,二是创建开放繁荣的AI生态。”
从阿里最高层的这些话中可以明显感觉到,在阿里看来,“不开放”即“无生态”,只有充分开放,才能构建起最活跃的生态,大模型时代也同样如此——开源是开放的重要前提和关键步骤,只有将大模型开源,才能降低大模型的使用门槛,激活国内的大模型产业,从而带动阿里云影响力的持续提升。
实际上,阿里云一直以来就有技术开放的传统,此前,包括云原生、数据库、操作系统、搜索引擎、基础软件和工具等一系列产品均已开源。另外,去年阿里云在云栖大会上推出AI开源社区“魔搭”,证明他们也早就为各种AI产品和大模型的开源做好了准备。
第二,大模型开源与阿里云较为丰富的云服务经验和较为充足的算力资源直接相关。早在2019年,阿里云就已开始了大模型的研发,目前已形成了基础设施即服务(IaaS)、平台即服务(PaaS)和模型即服务(MaaS)三层架构。
众所周知,大模型的构建绝非易事,其涵盖算力、算法、网络、大数据、机器学习等诸多领域,大模型的训练则是囊括算力底座、存储、AI框架、AI模型等复杂技术的系统性工程,在这些因素的支撑下,阿里云才能推出通义大模型系列和全栈化AI能力体系。
牛透社此前与业内人士就大模型的话题交流时有一个感受,为何国内很多企业不适合走开源大模型路线?一个重要的原因在于,无论是云服务商,还是大模型服务商,都囿于大模型研发所必需的算力资源,由于大模型的开源需要经过训练和推理,在此过程中,会消耗掉极多的算力,开发成本十分高昂,因此不是所有的企业都有这样的能力。
也就是说,只有在强大的云计算体系和超大规模基础设施的加持下,经过AI与云计算的深度融合,才能研发出高质量的大模型。而云服务是阿里云的立足之本,在底层资源和算力储备方面无需赘述,其选择开源路线“让算力更普惠,让AI更普及”,就是自然而然的了。
第三,大模型的开源,也与阿里云的业绩压力有关。这两年,阿里云的增速呈现放缓态势,上月发布的阿里最新财报显示,其营收增速更是仅为2%。从阿里云公布的消息来看,虽然选择了以不再分拆上市这样的方式体现云业务的价值,但阿里云的发展战略将围绕“AI驱动,公共云优先”这两大方向展开,业务上的“瘦身”不利于收入的增长,这仍然会为阿里云带来很大的压力。可以想见,在这样的策略之下,阿里云短期的业绩将持续低迷。
但在“AI驱动”的理念之下,阿里云目前考虑最多的已经不是规模和增长,而是怎样才能更好地把握住由AI带来的前所未有的新的机遇,这就需要阿里云首先重构自身的产品、技术和服务架构,打造AI明星项目,带来新增市场,提升生态吸附力,由此聚拢更多的企业和开发者以及拥有大模型模式的主导权,以更加开放的姿态和丰富的生态树立新的竞争力,让AI技术力和相关的生态建构力成为新的竞争标准,从而体现阿里云在该领域的影响力,还能够改变云服务的传统规则。
此外,阿里云开源大模型这一做法,还会对其潜在的大模型竞争对手,尤其是非阿里系的大模型创业企业形成冲击,进一步夯实阿里云的优势地位。
至此,阿里云大模型开源的逻辑已经很清晰了——作为“科技平台企业”,阿里希望向各行各业提供基础设施服务与各种数字化服务,以此为前提,阿里云的IaaS、PaaS、MaaS,分别对应基础设施、开放平台、开源路线,提供一整套服务,从云服务底层资源,到丰富的应用场景,再到开放的AI生态,从而形成新的商业模式,让业绩增长的飞轮得以加速旋转。虽然理想很美好,但阿里云是否真的能够在大模型的发展上占据上风?那些虎视眈眈的竞争对手们又会推出怎样的策略予以抗衡?
-
本文作者:刘佳庆
本文来源:牛透社
-
分享到: