关闭广告

350亿vs25000亿!国产模型正打破美国AI编程垄断

无相商业趋势834人阅读



产业竞争的烈火终究是烧到了大模型上,前段时间,知名编程模型Claude的开发商、估值超过3500亿美元(约合25000亿人民币)的Anthropic公司选择对华“断供”。而且不仅是对中国企业,也明确指出包含中国公司持股的海外企业。

国内企业陆续被暂停了Claude API使用,纷纷寻找替代品。包括字节跳动的TRAE和腾讯的CodeBuddy等编程平台的国内版,也被迫下架Claude模型,一时间风声鹤唳。

在大模型百花齐放的今天,Claude断供中国真的如此关键吗?答案是肯定的。

Claude之所以难以被替代,源于其深厚的技术积淀。在复杂算法实现和系统架构设计等高级编程任务中,Claude有更高的完成度,跨越了编程领域“可信”和“可靠”的心理阈值。

然而,机遇往往与危机并存。



1月底,一家中国大模型公司发布的新开源模型,因为突出的编程性能和视觉理解能力,引发了海内外技术社区和开发者的广泛关注。

连续一周登上Twitter科技新闻热搜,仅仅三四天时间,官方发布帖子的阅读量就达到了 680万,甚至不亚于美国OpenAI和Anthropic的旗舰模型发布帖子。顶尖AI技术领袖,160万粉丝的前特斯拉AI总监Andrej Karpathy、卡内基梅隆大学教授Tim Dettmers等专家也点赞恭喜。



从AI行业权威的评测机构LMarena(大模型匿名竞技场)代码能力基准测试中,这个名为Kimi K2.5的中国模型,排在全球开源模型的第一位,仅次于Claude和谷歌Gemini最新的旗舰模型。在前10名的榜单中,也是唯一的中国模型。



美国大模型技术最好的三家公司:OpenAI、Claude和Gemini,因为旗下模型的性能和实际表现总在排行榜的前列,通常被行业称为美国“御三家”。

这是第一次,中国公司通过开源模型打破了美国“御三家”的编程和视觉理解技术垄断。

美国另一家权威评测机构Artificial Analysis和中国模型基准测试机构SuperCLUE的分析都显示,Kimi K2.5模型的智能水平是全球开源第一,仅次于闭源的美国“御三家”。

在特别注重编程性能的AI领域,但凡有一款大模型做到关键指标领先,就会被迅速推开。

Kimi K2.5一经推出后,海外知名编程工具Kilo Code就迅速接入,并宣布首周免费来吸引用户。国内,腾讯旗下编程工具CodeBuddy、字节跳动旗下编程工具TRAE也第一时间上架,因为突出的编程能力,和同时支持视觉的完备性,立即成为首选国产模型。



而发布Kimi K2.5模型的这家中国创业公司,却有个略显“中二”的名字,叫月之暗面。2025年底,他们刚刚完成了C轮35亿元的融资,公司总估值在350亿左右。仅为Anthropic 2.5万亿的1/70。



和很多工业软件一样,在编程大模型领域,中国的业界曾经也处于被卡脖子的状态。

据行业评测数据显示,Claude在复杂算法实现、系统架构设计等高级编程任务中的完成度显著高于行业平均水平。在市场生态方面,Claude也因为先发优势,构建了完整的开发者服务体系,形成了显著的用户粘性,特别是大型企业用户的年均续约率更高。

也正是基于这些优势,Claude的相关模型价格高了国内5-7倍。

那么贵,为什么不用国产?

不得不承认,在这个中国模型亮相之前,国产编程模型存在明显的技术差距。

首先是模型的智能水平,海外模型基本都是万亿参数起步,才能做到对广泛任务和高难度任务的较好应对。中国主要是几千亿参数的模型,难以应对较为复杂的任务,只能做一些非常简单的编程工作。

然后是,中国主流模型在架构设计上普遍采用纯文本预训练,缺乏视觉模块的整体集成。这意味着模型无法理解图像包含的语义信息,在需要多模态理解的场景中表现受限。

比如在前端开发领域。某大型电商平台技术团队曾进行对比测试:当要求模型根据UI设计稿生成前端代码时,必须有很强视觉能力,才能准确识别设计稿中的布局关系、色彩体系和交互元素。

视觉理解能力的技术门槛主要体现在三个层面:首先是视觉信号编码,需要将像素信息转化为有意义的特征表示;其次是跨模态对齐,要求模型理解视觉内容与文本描述之间的关联;最后是统一表示学习,需要建立共享的语义空间。

这些技术难题如同几座大山,阻碍了国产编程模型的进阶之路。

而在实际应用中,这种技术差距直接影响了开发效率。开发效率的差距进一步影响了产品的迭代速度,这在快速变化的市场环境中是致命的。

大模型不同于新能源汽车,要想超车,没有技术以外的捷径可走。

面对技术壁垒,中国公司选择对大模型的底层架构进行革新。

比如Kimi K2.5采用了原生多模态架构,通过ViT+Transformer的混合编码器实现图像和文本的联合表示,在模型底层实现了信号融合。

这种设计相比传统的后期融合方法,在语义保持度和计算效率上具有显著优势,具体而言,模型在训练过程中就建立了视觉与文本的深度关联,而非简单地将两个独立的模型输出进行拼接。

此外,据了解,在Kimi K2.5模型的开发中,这家公司还重点优化了训练基础设施,通过重构强化学习框架,让训练效率提升数倍。

而在视觉理解能力的痛点上,Kimi K2.5更是实现了对Claude的反超:在界面设计稿转代码任务中,Kimi K2.5可准确识别组件的空间关系、样式属性和交互逻辑,代码生成准确率超过Claude。

更为友好的是Kimi K2.5的定价:API调用的输入价格为4元/百万Token,仅为Claude中号模型Sonnet 4.5的1/5,大号模型 Opus 4.5 的1/8。

对于那些每年在大模型上砸数千万元的互联网企业而言,终于等到了一个全功能的、代码和视觉能力都很强的Claude中国平替模型。



当然,一个大模型好不好用,性能到底受不受认可,最终都是市场来说话。

OpenRouter数据显示,Kimi K2.5上线第二天即进入日活跃度前三。



全球最大、估值超千亿的AI搜索创业公司Perplexity,第一时间上架了Kimi K2.5模型,作为给付费用户的高级模型使用。在Perplexity平台上,这也是唯一的中国模型。



从全球开发者的实际反馈来看,这个名为Kimi K2.5的模型,编程能力的表现非常突出, “可以挑战Claude的中号模型Sonnet 4.5,略逊于大号模型Opus 4.5”,同时价格只有他们的1/5到1/8,性价比优势突出。

知名编程工具Cline的开发专家Juan Pa发帖称,他在一项实际编程任务中测试了Codex 5.2、Opus 4.5 和 Kimi K2.5三个模型,他的测试结果是“Kimi K2.5以38%的成本达到了约Opus 90%的质量。”



人工智能专家Mariusz Kurman则建议,“在项目计划阶段使用Opus4.5模型,在创建阶段使用Kimi K2.5模型,可以达到最佳效果。”



在国内技术社区上,开发者们实测之后反馈称,“Kimi K2.5多模态能力以及coding能力还可以的,作为Gemini Pro。Claude和GPT5.2 codex模型的替代也是不错的。国产模型越来越好了。”



一直以来,很多人都以为在AI竞赛上,美国企业主导基础模型层,而中国企业只是擅长应用开发。

2025年初,DeepSeek的出现打破了这种判断。2026年初,这家叫月之暗面的公司推出的新模型,则在编程这个关键领域再次突破了美国模型的垄断。

事实上,这家公司并不是2026年初才横空出世的。早在2025年中,他们就因为首个万亿参数的开源模型K2受到了国际社会的关注,被英国自然杂志称为中国的另一个DeepSeek时刻。

而在硅谷广受欢迎的All-In Podcast中,Kimi K2.5也被直接定义为“开源AI的重要里程碑”。



硅谷知名的风险投资家、企业家Chamath Palihapitiya将Kimi K2.5的发布和带来的反响概括为“Kimi K2.5时刻”。

作为一位曾参加白宫科技圆桌会议并采访过美国总统的权威人士,Chamath认为,开闭源已不只是技术路线之争,而是企业、组织乃至国家层面的“基础设施选择”。

由此可见,我们需要更多的DeepSeek时刻,需要看到更多中国力量的突破,不是一个DeepSeek,而是一大批DeepSeek。特别是在地缘政治不确定性的背景下,本土模型更是中国企业的刚需,因为在核心系统中采用自主可控的AI技术,既是商业选择,也是战略必须。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊姐周日热推:电视剧《老舅》;电视剧《哑舍》......

伊周潮流 浏览 1280

法兰克福的六号位仍是敏感话题

绿茵情报局 浏览 966

给她的宇宙,Matthieu Blazy重塑香奈儿女性

时尚COSMO 浏览 2032

猛士汽车2025全年销量10228台 同比增长387%

网易汽车 浏览 963

破局“影子AI”!神州控股科捷小金Agent,打造行业供应链专家

野马财经 浏览 1979

央视一周 4 次点名全红婵,夺冠后真实处境揭开

寒士之言本尊 浏览 1667

精致智能代步车 零跑A10还有激光雷达

网易汽车 浏览 1064

网坛名宿预测德约在澳网后退役,被六千名塞尔维亚球迷围攻

网球之家 浏览 1727

特朗普被指非常重视"和平峰会" 以色列哈马斯或不参加

环球网资讯 浏览 8603

范德芬:我知道我加速后别人很难追上,那一刻只想着必须进球

懂球帝 浏览 1606

注射后48小时有知觉,6人重新行走!巴西科学家破解脊髓损伤难题

DeepTech深科技 浏览 867

普通人秋天应该怎么穿衣?颜色选对、衣服穿对,简单又大方

静儿时尚达人 浏览 1565

梅西创造完成美职联50球最快纪录,此前由约瑟夫和伊布保持

懂球帝 浏览 1812

体图:格纳布里愿意接受较低薪资,拜仁可能和他续约两年

懂球帝 浏览 1838

短剧男主遇上长剧男主,谁是天然帅哥谁是滤镜美男,差距一目了然

娱乐圈笔娱君 浏览 1487

男子花3万请网红带货:下599单仅成交4单收入700元

环球网资讯 浏览 3798

毛茸茸的冬天,毛孩子们都在想什么?

时尚COSMO 浏览 1453

黄宗泽哭着拿双料视帝,10次提名终于熬出头

手工制作阿歼 浏览 1160

塔吉克斯坦总统强烈谴责塔阿边境地区武装袭击事件

环球网资讯 浏览 1340

派系纷争不断 加沙秩序恢复仍需时间

极目新闻 浏览 1746

马卡:皇马将在国家德比展出巨型TIFO,彰显俱乐部的历史

懂球帝 浏览 1840
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1