关闭广告

发布多模态交互开发套件,发力硬件抢占入口!阿里云已兵分两条路布局AI手机

时代财经1137人阅读

本文来源:时代财经 作者:郭美婷

2026年开年,阿里云的“第一枪”打响在硬件。

1月8日,阿里云通义智能硬件展在深圳举办,阿里云发布多模态交互开发套件,该套件集成了千问、万相、百聆三款通义基础大模型,并预置十多款生活休闲、工作效率等领域的Agent和MCP工具,可应用于AI眼镜、学习机、陪伴玩具、智能机器人等硬件设备。

阿里云通义大模型业务总经理徐栋在接受时代财经等采访时表示,该多模态交互开发套件的核心是为开发者一站式降低门槛,具备四大特点:一是集成丰富模板,支持拖拉拽开发及自有SDK接入,大幅降低开发门槛;二是将按Token计量的计费模式改为按硬件终端的License模式,便于硬件厂商控制成本、匹配商业逻辑;三是通过工程最佳实践保障模型调用的速度、性能与可扩展性,提升使用体验;四是整合阿里生态能力,助力开发者实现更低成本开发、适配多元售卖逻辑、便捷开发及生态对接等需求。


徐栋,图源:时代财经摄

在流量红利逐渐见顶的当下,硬件入口已成为了互联网大厂们争相抢夺的“香饽饽”。大厂们试图通过硬件入口突破增长瓶颈,将软件生态的优势延伸至物理世界,以构建起硬件、软件、服务的商业闭环。

“今天大模型跟硬件结合,它确实就会带来新的流量。”徐栋表示,硬件有助于实现消费者体验的完整闭环,例如AI眼镜。“如今,众多厂商都在探索如何借助这类硬件入口,将更多服务融入自身生态,从而为用户提供更完整、连贯的体验。我认为这是目前行业内许多企业正在重点思考的方向。”

去年底,豆包和中兴(000063.SZ,00763.HK)合推的“AI手机”nubia M153引发广泛关注和讨论。在该款手机上,豆包将能够在多款应用间自动跳转,完成类似查票订票、商品下单、批量下载文件、多软件物流进度一键查询等任务。这条技术捷径,既引发了关于隐私、数据和安全的讨论,也冲击着布局AI的智能手机厂商们。

“从广义上看,手机的定义正经历显著变化,这一点我们早在多年前便已有所预见。”徐栋提到,许多手机厂商强调其“超级助手”功能,但该概念长期以来并未形成足够清晰的界定。当前,不少互联网厂商正试图通过接入手机系统权限来获取更多流量,但总体而言,这一趋势仍处于发展的早期阶段。

他表示,目前AI手机有两条路线,一条路线是GUI(图形用户界面),一条路线是A2A(Agent To Agent,应用间自动化交互)。据透露,目前阿里云在这两条路线上均有所布局,去年底,通义实验室多模态交互团队就宣布开源了其通用GUI智能体基座模型MAI-UI。

他进一步补充,GUI与A2A两条路线当前尚处于早期阶段,正在并行发展。“短期来看,我认为A2A的发展速度较快,其体验更优、响应更快,且模型运行成本较低。如果完全依赖GUI路线,以一部手机日均使用量计算,长期累积的成本可能更高。此外,通过多模态视觉交互完成一次操作,所涉及的计算资源也值得考量。总体而言,这些方向都颇具探索价值,也十分有趣。”徐栋称。

去年,阿里启动“千问”项目,基于Qwen模型打造千问APP,并称要全面对标ChatGPT。此举被业内认为是阿里转战C端的关键落子。

徐栋谈到,阿里云正尝试将在ToC产品中积累的部分能力,通过ToB合作形式向企业开放,同时也在ToC业务中探索拟人化交互的实现,并为企业客户降低开发门槛与成本。

1月8日,阿里云还宣布了与乐聚机器人的全栈AI合作,双方将基于阿里云算力、AI平台、千问模型,共同开展人形机器人训练场合作,以及探索基于千问模型的具身智能联合解决方案和人形机器人产品的开发。


图源:阿里云官方公众号

据徐栋介绍,目前阿里云在具身智能领域主要探索的合作方向有两个:其一是多模态交互。即基于千问Omni多模态模型与多家机器人公司开展合作,主要应用于低延时、拟人化的交互场景,并具备支持出海的多语言能力。该方向已相对成熟,但受限于机器人市场规模,目前应用规模尚有限;其二是VLA技术,目前阿里云正开展相关研究,预计2026年下半年可见初步进展,但实现高度泛化的VLA仍需时间。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

仅买10天的哈弗大狗高速上突发变速箱故障 车主后怕

大风新闻 浏览 1112

理财代销加速下沉 热销背后警惕收益率“美化”

北京商报 浏览 1525

古二再度放料!秦雯王家卫吐槽出现新人物

萌神木木 浏览 1564

海南封关,就能半价买豪车了?

汽车公社 浏览 1289

还有反转?上周五“精准做空”引发全市场关注,神秘交易员再度开出1.6亿美元空单

华尔街见闻官方 浏览 1987

强化AI编程能力迎战谷歌!OpenAI发布GPT-5.2-Codex,软件工程和网安一把抓

华尔街见闻官方 浏览 1340

E句话|“我只眼神给出去”?黑白颠周媛账号被封

仙女事件簿 浏览 929

对话Memories.ai:“人的记忆本质上是视觉,AI也该如此”

硅星人 浏览 1526

聂远不让女儿雨天上学,黄磊女儿满口错别字,怪不得星二代要进圈

萌神木木 浏览 1429

海底捞小便案详情披露:俩17岁男生玩游戏 家长赔220万

潇湘晨报 浏览 4518

曾炒到1600元/粒的"中药茅"大跌价 公司市值蒸发1800亿

每日经济新闻 浏览 7372

男子被钻机拧断胳膊未获赔 法院查封800吨煤被矿方私售

大风新闻 浏览 8272

记者:弗里克听说自己的明夏离队传闻后说“又是胡说八道”

懂球帝 浏览 1554

《向往》收视回暖!黄磊动手做饭,明星干农活

萌神木木 浏览 1749

乌代表团赴美谈判 俄乌互相袭击

新华社 浏览 1391

汇聚超千项前沿成果,第八届长三角科技成果交易博览会开幕

蓝鲸新闻 浏览 1902

巴黎极端球迷在埃菲尔铁塔前非法燃放大量焰火,约40人被逮捕

懂球帝 浏览 1265

退休三年后“落马”,恒邦财险原董事长肖晓华被查

蓝鲸Insurance 浏览 986

男子应聘船员出海严重晕船自缢:一吃就吐 甚至用头撞墙

极目新闻 浏览 8061

亲历茅台打假办鉴酒翻车,线上的飞天还敢买吗?

虎嗅APP 浏览 1375

流落柬埔寨的福建女网红和家里通话 问"何时来接我"

极目新闻 浏览 4075
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1