关闭广告

AI落地加速中,底层架构却成最大绊脚石?丨ToB产业观察

钛媒体APP378人阅读


2025年上半年,中国AI基础设施服务市场规模达198.7亿元,同比激增122.4%。IDC预测,这一数字将在2029年逼近1500亿元。与市场狂热形成鲜明对比的是,Gartner报告曾指出:“超50%的AI项目因架构问题无法上线”。

当生成式AI(GenAI)从技术验证走向规模化应用,企业正陷入“算力渴求与效率瓶颈并存、创新需求与架构桎梏交织”的矛盾。

被架构困住的智能转型

赛迪顾问在《企业级AI应用落地白皮书2025》中指出,尽管83%的企业将AI列为战略优先级,但实际落地成功率仅29%。

与此同时,Gartner在《2025年企业AI架构成熟度报告》中指出,AI落地失败的根源并非单一技术缺陷,而是“算力供给、数据治理、系统协同、安全合规”构成的系统性架构失衡。这种失衡在不同行业呈现出共性挑战,却又因场景差异衍生出个性化难题。

对此,青云科技CEO林源表示,从ChatGPT问世之后,2023年开始,至今企业的数智化转型已经经历了三个阶段。

  • 第一个阶段,当ChatGPT带来了新一轮AI浪潮之后,智能算力的紧俏成为阻碍企业AI应用的最大难题。甚至至今,高性能的算力也依旧是困扰企业AI落地的一个痛点,Gartner预测,2025年全球AI训练算力缺口将达42%,中国市场这一比例将升至55%。“当时市场的主要的痛点是,非专业的算力投资者如何去解决算力管理和运营的问题,”林源进一步指出,“所以青云当时提出了AI Infra 1.0,其核心也是让智算投资者能运维运营智算中心。”
  • 第二个阶段,随着智算中心的建设,越来越多的客户也愿意对AI进行尝鲜。而在更多行业不同场景的客户去拥抱AI的过程中,不同的场景,也存在差异化的需求,这些方面在当时是无法得到充分满足的。
  • 第三个阶段,当DeepSeek爆发之后,企业对待AI的态度也从“尝鲜”走向了认真考虑如何让AI在企业内部落地的方向。在林源看来,这个过程企业会面对更多的问题。

当企业处于AI应用第三阶段时,首要面对的就是一些“历史遗留”的IT架构问题。原先,企业IT架构的多代际叠加导致算力资源碎片化。IDC《2025企业算力管理报告》显示,制造企业平均存在4.2个独立算力池(传统服务器、虚拟化集群、GPU节点等),跨池调度效率仅为28%。67%的制造企业坦言:“算力与存储升级跟不上模型迭代速度”。“多重架构带来的是企业级AI落地过程中,更为多重的挑战。”林源强调。

此外,为追求上线速度,53%的企业采用紧耦合AI架构,将模型训练、推理与业务系统直接绑定。这种“一次性搭建”模式的代价在迭代阶段集中显现。

另一方面,企业内部的IT团队与业务部门也面临着问题和冲突,企业的业务越来越复杂、越来越多元化,新技术又让企业业务的更迭频率变快。在面对这么复杂多变的企业应用的场景之下,企业的IT部门能力难以支撑,往往疲于奔命。“不仅如此,在现在的大环境之下,企业一方面要做技术创新,另一方面还要面对业务稳定性的刚性要求,这样让企业内部的数字化团队更加举步维艰,做多反而错多。”林源一语道破了企业当前应用AI的痛点。

此外,边缘与中心算力协同不足加剧失衡。随着AI推理向边缘设备扩散,企业需同时管理智算中心集群与边缘节点,但据赛迪顾问数据显示,仅19%的企业实现算力协同调度。

总体来看,企业当前面对着“既要,又要,还要”的三重核心挑战,林源表示,首先,企业既要保留历史IT投资,又要拥抱AI创新,实现新老兼容;其次,面对愈发多元化的业务需求与越简单越好的IT架构诉求之间的矛盾,企业如何平衡好两者之间的关系;第三,企业需要在创新过程的技术迭代性的同时,满足业务的稳定性。

AIInfra破解落地困局的核心引擎

面对如此多的挑战和问题,企业需要一座衔接历史与未来的“桥梁”,在林源看来,这座桥梁需要具备三个特性:首先,新的IT与应用必须要兼容用户原有的IT资产,必须要尊重客户现有的存量业务。

其次,新的IT架构必须具备按需部署,可“进化”的特性,“所有的客户都非常担心一步到位的技术革命,因为企业会面临极大的风险与极高的成本压力。同时不同客户的阶段不同、能力不同、需求不同,所以我们需要能够满足不同客户的按需、分阶段升级的需求。”林源强调。

第三,要确保在每次IT架构迭代的过程中,用户业务的连续性、数据安全和升级的平滑性。

而AI Infra的出现让这些问题有了统一的解题思路。赛迪顾问将2025年定义为“中国AI Infra平台应用元年”,其核心价值在于通过“算力统筹、存储革新、架构整合、生态开放”四大能力,实现AI落地的“降本、提效、安全、可控”。

通过“全域调度、弹性伸缩、能效优化”三大技术路径,AI Infra能让“碎片化”的算力,统筹到一起,形成“一体化”的算力平台,从而提升算力的利用效率,破解算力供给难题,推动算力资源价值最大化。

AI Infra通过整合GPU/TPU/DCU等多元芯片,构建统一调度的异构算力池,实现“按需分配、动态扩容”。除此之外,通过AI Infra,企业还能实现国产化算力应用的突破。比如,华为昇腾910B芯片已实现千亿参数大模型训练,寒武纪CMX-9芯片以15瓦功耗实现64TOPS算力,适配边缘场景需求。燧原科技在庆阳部署的国产异构智算中心,成为“东数西算”示范项目,单集群算力达100PFLOPS,成本较进口方案降低35%。

而在算力调度方面,基于云原生技术的统一调度平台成为核心。通过算力标签与性能预测模型,实现资源与业务的精准匹配。

以青云科技为例,据林源介绍,青云的KubeSphere调度层实现了“通算+超算+智算”的全域整合,“在统一的调度层之上,就是青云不同能力的呈现,包括企业需要的完整虚拟化能力、全栈云能力、云原生的能力,以及AI智算的能力,都可以在这个统一平台去呈现。这一层是全功能的,确保了客户的业务能够随着IT架构的变革实现逐步的进化,保障客户业务的连续性。”林源介绍道。

在制造业案例中,某制造业企业面临虚拟化管硬件、云原生管应用、智算平台管算力统一纳管的困境。原先该企业需要使用三套系统、三套流程,造成了跨平台协调的高内耗。而据林源介绍,基于青云AI Infra 3.0架构,该企业实现了架构协同,“无论是数据存储分析、云原生应用部署,亦或是推理算力供给,都在一个平台上进行搭建和交付。这实现了全链路自动化,将 IT 部门响应业务部门的速度从 1 小时大幅缩短到 15 分钟。这不仅是效率提升,更是业务竞争力的重塑。”林源如是说。

在生物制药案例中,用户利用AI Infra 3.0架构中成熟的模型服务能力来对接专业大模型,通过模型和推理引擎分离架构来选择最适配的推理引擎,及时解决对接集成工作,让客户能快速上线医疗AI分析能力,将新型药物的分子设计周期从18个月压缩至12个月,将高性能复合材料的微观结构模拟时间从72小时缩短到43小时。

而这仅是AI Infra价值的“冰山一角”。IDC《2025 AI Infra价值评估报告》指出,部署新一代AI Infra的企业,AI项目上线率从29%提升至78%,投资回报率提高120%。

AI Infra迎来商业化爆发

AI Infra的战略价值引发全球厂商激烈角逐。Dell'OroGroup预测,2025年全球AI Infra市场规模将突破800亿美元,年复合增长率达58%。当前市场呈现“国内厂商聚焦本土痛点、国外厂商强化技术壁垒”的格局,细分领域的竞争已进入白热化。

厂商纷纷布局的背后是AI Infra技术竞赛,国内厂商主要围绕“信创适配、架构整合、成本控制”三大本土需求,形成“全栈型、垂直技术型、生态整合型”三类玩家,成为目前市场上的主导。

全栈型方面,青云科技以“桥梁式架构”破解历史兼容难题,其AI Infra 3.0通过PrimusOS内核层与KubeSphere调度层,实现多代际架构整合;华为以昇腾芯片为核心的全栈布局,覆盖“芯片-框架-平台-应用”。昇腾910B芯片支持千亿参数模型训练,Atlas350标卡适配超节点部署,某科研机构的大模型训练效率提升25%。阿里云以规模算力与生态整合见长,灵骏AI集群支持千卡规模训练,GPU弹性算力响应时间缩短至5分钟。分布式存储系统支持千亿级小文件调度,推理时延控制在6ms以内,服务比亚迪等车企,自动驾驶模型训练周期缩短50%。

垂直技术型方面,浪潮信息的AI服务器全球市占率47%,液冷技术使PUE降至1.15。某智算中心采用其方案后节能40%,年均电费减少280万元。2025Q1其AI服务器出货量同比增长62%,稳居全球第一;国产GPU企业燧原科技在庆阳异构智算中心中应用的算力规模达100PFLOPS,成本较进口方案降低35%。其云燧T20GPU已适配100+AI模型,在政务、金融领域的渗透率达18%。

生态整合型方面,腾讯云以“云原生+Agent”推动生态协同,国内首个跨型号GPU调度的Serverless平台,模型启动速度提升17倍。Agent Infra解决方案支持数十万实例并发,服务货拉拉等企业,车路协同响应时延降至15ms;百度智能云则是聚焦模型与Infra协同,文心一言大模型与千帆AI平台深度整合。

放眼国际,与国内服务商相比,国际服务商主要周期全球化与生态上,稍有领先。微软Azure通过“云+AI”深度融合,打造了全球首个NVIDIA GB300 NVL72集群(4600+BlackwellUltraGPU),支持OpenAI超大规模推理,内存带宽1.44exaflops。自研Maia 100 AI芯片(5nm工艺)功耗较竞品降低30%,部署于GPT-3.5Turbo推理,但在中国区市场占有率仅5%;AWS则是凭借模块化与成本方面的优势,占有一席之地。其Trainium2芯片性能是第一代4倍,Trn2 UltraServer支持64芯片集群,训练成本较GPU降低30-40%。IoT Greengrass支持边缘推理,与SageMaker集成。

基于此,赛迪顾问预测,未来3年全球AI Infra市场将呈现“双轨并行”格局——中国市场国产化率将从2025年的45%提升至2027年的65%,政务、金融等领域实现100%国产化;全球高端市场仍由NVIDIA、微软等主导,市占率保持70%以上。

放眼全球,AI Infra的竞争已从单一产品比拼升级为“技术-生态-场景”的综合较量。国内厂商需在保持成本与场景优势的同时,突破高端芯片、基础软件等核心技术瓶颈。未来的赢家,必将是既能掌控核心技术,又能深刻理解行业需求的企业。

2025年作为AI Infra应用元年,标志着企业AI转型从“概念探索”进入“规模化落地”的关键阶段。AI融入企业运营的每一个环节,成为驱动生产力变革的核心力量,已经是不可逆的事实,而AI Infra,正是开启这一时代的关键钥匙。(文|Leo张ToB杂谈,作者|张申宇,编辑丨盖虹达)

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

预装近50个充电桩没接线缆 上海一小区现"糊弄式"配套

上观新闻 浏览 61158

近半年“主观VS量化”!但斌、吴悦风位列前5!翰荣、念觉领衔

私募排排网 浏览 551

潍坊一水库水现石油色承包人称死鱼超3万斤 当地回应

澎湃新闻 浏览 3628

连马斯克都盯上了这块“肥肉”

汽车公社 浏览 388

中国色特别策划 | 故宫建筑与阙羽重光

时尚COSMO 浏览 449

AI杀入美股,DeepSeek又是第一!港大90后开源,AI股神人人都能造

新智元 浏览 606

缺席训练!曝25岁主力门将遭申花“三停”,上轮中超赛后通宵泡吧

我爱英超 浏览 552

她被骂“文盲”影后,如今搭档黄轩交出满意答卷

仙味少女心 浏览 662

伊姐周六热推:电视剧《亦舞之城》;电视剧《时差一万公里》......

伊周潮流 浏览 65

李玉刚现身年会商演,富婆证实其出场费上百万

盖饭娱乐官方号 浏览 17201

10天9涨停!又一超级大妖股彻底爆了

财经锐眼 浏览 671

双11的「阳谋」,李佳琦都没躲过

豹变 浏览 452

@切尔西 不能签卖身契了!欧足联新规:球员签约成本摊销上限5年

直播吧 浏览 12666

福建发布人工智能扶持新政:拟对企业年度算力购买最高补助50%

观察者网 浏览 474

英媒:意甲俱乐部在关注拉斯金,热刺和狼队也对其感兴趣

懂球帝 浏览 423

舰机协同、“狩猎”海天!海军某舰艇编队开展反潜训练

环球网资讯 浏览 14286

短剧要翻拍《新英雄本色》,短剧一哥刘萧旭主演,海报有内味儿

最爱酷影视 浏览 839

OpenAI与博通达成数十亿美元芯片开发协议

国际金融报 浏览 832

5年内在英国推出10款新车 吉利EX5伦敦上市售3.199万英镑起

网易汽车 浏览 675

消费者兴趣低于预期 苹果“大幅”削减 iPhone Air 的产量

威锋网 浏览 628

拉科布声明未来2年所有人将在一起 这意味着勇士不引援了?

仰卧撑FTUer 浏览 782
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1