科技云报道原创。
在过去近一年的时间里,AI大模型从最初的框架构建,逐步走到落地阶段。
然而,随着AI大模型深入到千行百业中,市场开始意识到通用大模型虽然功能强大,但似乎并不能完全满足不同企业的个性化需求。
大模型技术的安全性、解释性、易用性等综合指标正在成为此轮AI竞赛的关键,部分企业不再执着于大模型的开发,而把目光向普惠式AI、生成式AI+多云、大模型的私有化部署等多种商业模式。
AI与云计算迎来大融合时代
从诞生起,云计算一直被认为是未来的发展方向、互联网企业们的“第二增长曲线”。
但是,受互联网增长红利见顶以及政策监管趋严的影响。从2021年开始,原本处在高速增长阶段的云服务商们纷纷陷入了增速放缓的阶段。从高峰时的超过50%的增速,一路跌至2022年的20%,甚至更低。
全球产业需求的消退,导致云计算行业增速失调。根据研究机构TrendForce今年2月的预警,Meta、微软、谷歌、亚马逊这四家云厂商的服务器采购量可能从年增6.9%放缓至4.4%。
不过,拐点很快到来。在ChatGPT出现后,即使行业需求放缓,国内外云服务商们也在积极将业务重心转移至AI领域。
可见云服务商们逐渐从上半场的“求速度”转变为落地于产业深处,去寻求更高的价值增量。
随着第一波上云的完成,企业正在进入深度用云阶段。AI与云的结合不仅能够进一步降低企业上云的门槛,还能为企业实现业务深度的智能化。
根据Gartner《2022年人工智能技术成熟度曲线》报告,尽早采用复合型人工智能(AI)、决策智能等AI技术将给企业机构带来明显的竞争优势,缓解AI模型脆弱性引发的问题,有助于捕捉业务背景信息,推动价值实现。
今年4月中旬,阿里云智能首席商业官蔡英华对外表示,算力的飞速发展使数字化成为确定,使智能化成为可能。
未来阿里云将以云计算为基石,以AI为引擎,参与到从数字化迈向智能化的划时代变革中。
AI走向普惠的一大步
英伟达第二财季的业绩惊艳众人,其背后是生成式AI革命中,行业对高性能算力的迫切需求,然而现在,昂贵的算力成本下,AI大模型似乎仍是个“富人游戏”。
面对GPU价格的暴涨与未来可能到来的“算力荒”,大公司砸钱囤卡,尚可悠然步入AI竞技场,而中小企业没有“钞能力”,在发展AI模型、应用过程中,更容易受算力制约。
拿什么来拯救AI算力资源极度不均衡的现状?如何让更多创业者参与到大模型的市场竞争中?
作为全球GPU龙头供应商、此轮AI热潮最大的受益者,英伟达给出了破局之道——算力租赁。
今年3月,英伟达正式推出算力租赁服务方案“DGX云”,该方案由英伟达与微软云、谷歌云、甲骨文等全球top10的云服务商共同打造,企业通过一个浏览器就可以按月租用英伟达DGX AI超级计算机,不需要采购与拥有服务器设备。
事实上,英伟达DGX云并非AIGC产业首例,但由于DGX AI超级计算机的杰出性能,DGX云将AIGC云算力产业推向了更高的起点,该服务推出标志着AI云算力进入新阶段。云算力采用“化整为零”的方式赋能产业链各方,具备可持续性。
算力租赁,即对算力进行出租,是一种通过云计算服务提供商租用计算资源的模式。算力生产商与云平台的合作由来已久,用户可以通过阿里云、腾讯云等平台租用英伟达的显卡与AI处理器。
对于英伟达与云服务商来说,算力租赁是实现双赢的策略。
全球第七大云服务商甲骨文是最先响应英伟达DGX云计划的大厂,该公司于2022年10月将英伟达加速计算堆栈工具(包括GPU 、系统、软件)迁移到其IaaS业务的旗舰产品——云服务平台OCI(Oracle Cloud infrastructure)上。