关闭广告

发布多模态交互开发套件,发力硬件抢占入口!阿里云已兵分两条路布局AI手机

时代财经1109人阅读

本文来源:时代财经 作者:郭美婷

2026年开年,阿里云的“第一枪”打响在硬件。

1月8日,阿里云通义智能硬件展在深圳举办,阿里云发布多模态交互开发套件,该套件集成了千问、万相、百聆三款通义基础大模型,并预置十多款生活休闲、工作效率等领域的Agent和MCP工具,可应用于AI眼镜、学习机、陪伴玩具、智能机器人等硬件设备。

阿里云通义大模型业务总经理徐栋在接受时代财经等采访时表示,该多模态交互开发套件的核心是为开发者一站式降低门槛,具备四大特点:一是集成丰富模板,支持拖拉拽开发及自有SDK接入,大幅降低开发门槛;二是将按Token计量的计费模式改为按硬件终端的License模式,便于硬件厂商控制成本、匹配商业逻辑;三是通过工程最佳实践保障模型调用的速度、性能与可扩展性,提升使用体验;四是整合阿里生态能力,助力开发者实现更低成本开发、适配多元售卖逻辑、便捷开发及生态对接等需求。


徐栋,图源:时代财经摄

在流量红利逐渐见顶的当下,硬件入口已成为了互联网大厂们争相抢夺的“香饽饽”。大厂们试图通过硬件入口突破增长瓶颈,将软件生态的优势延伸至物理世界,以构建起硬件、软件、服务的商业闭环。

“今天大模型跟硬件结合,它确实就会带来新的流量。”徐栋表示,硬件有助于实现消费者体验的完整闭环,例如AI眼镜。“如今,众多厂商都在探索如何借助这类硬件入口,将更多服务融入自身生态,从而为用户提供更完整、连贯的体验。我认为这是目前行业内许多企业正在重点思考的方向。”

去年底,豆包和中兴(000063.SZ,00763.HK)合推的“AI手机”nubia M153引发广泛关注和讨论。在该款手机上,豆包将能够在多款应用间自动跳转,完成类似查票订票、商品下单、批量下载文件、多软件物流进度一键查询等任务。这条技术捷径,既引发了关于隐私、数据和安全的讨论,也冲击着布局AI的智能手机厂商们。

“从广义上看,手机的定义正经历显著变化,这一点我们早在多年前便已有所预见。”徐栋提到,许多手机厂商强调其“超级助手”功能,但该概念长期以来并未形成足够清晰的界定。当前,不少互联网厂商正试图通过接入手机系统权限来获取更多流量,但总体而言,这一趋势仍处于发展的早期阶段。

他表示,目前AI手机有两条路线,一条路线是GUI(图形用户界面),一条路线是A2A(Agent To Agent,应用间自动化交互)。据透露,目前阿里云在这两条路线上均有所布局,去年底,通义实验室多模态交互团队就宣布开源了其通用GUI智能体基座模型MAI-UI。

他进一步补充,GUI与A2A两条路线当前尚处于早期阶段,正在并行发展。“短期来看,我认为A2A的发展速度较快,其体验更优、响应更快,且模型运行成本较低。如果完全依赖GUI路线,以一部手机日均使用量计算,长期累积的成本可能更高。此外,通过多模态视觉交互完成一次操作,所涉及的计算资源也值得考量。总体而言,这些方向都颇具探索价值,也十分有趣。”徐栋称。

去年,阿里启动“千问”项目,基于Qwen模型打造千问APP,并称要全面对标ChatGPT。此举被业内认为是阿里转战C端的关键落子。

徐栋谈到,阿里云正尝试将在ToC产品中积累的部分能力,通过ToB合作形式向企业开放,同时也在ToC业务中探索拟人化交互的实现,并为企业客户降低开发门槛与成本。

1月8日,阿里云还宣布了与乐聚机器人的全栈AI合作,双方将基于阿里云算力、AI平台、千问模型,共同开展人形机器人训练场合作,以及探索基于千问模型的具身智能联合解决方案和人形机器人产品的开发。


图源:阿里云官方公众号

据徐栋介绍,目前阿里云在具身智能领域主要探索的合作方向有两个:其一是多模态交互。即基于千问Omni多模态模型与多家机器人公司开展合作,主要应用于低延时、拟人化的交互场景,并具备支持出海的多语言能力。该方向已相对成熟,但受限于机器人市场规模,目前应用规模尚有限;其二是VLA技术,目前阿里云正开展相关研究,预计2026年下半年可见初步进展,但实现高度泛化的VLA仍需时间。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

专访顶新便利餐饮 游仁宏:便利店的核心壁垒,是人与温度

新零售财经 浏览 2024

三星:明年的 HBM 内存产能已售罄,考虑扩建生产线

IT之家 浏览 1644

美参议员就谷歌与特朗普达成2200万美元和解协议质询谷歌、YouTube

界面新闻 浏览 1865

用她和朱珠比较,不太公平?

江湖人称艾掌门 浏览 1676

禁毒警察被控走私毒品获刑三年半 本人称系"工作行为"

新京报 浏览 4169

观众对白百何的评价,明白了当年宋丹丹那番话

娱乐圈笔娱君 浏览 1605

东南大学团队首次揭示:视觉欺骗如何让AI"看走眼"

科技行者 浏览 974

戴奇:阿森纳不只靠定位球得分;与津琴科沟通过提前结束租借

懂球帝 浏览 1022

驻韩美军一“死神”无人机失控坠海 9月才被部署在朝鲜半岛

红星新闻 浏览 1385

欧盟高官:美国对格陵兰岛的威胁“极其令人担忧”

国际在线 浏览 1029

一年中最不能错过的推送,超适合过年看!

黎贝卡的异想世界 浏览 536

太空“4S店”要开张:Starfish验证“单眼”卫星交会PRO操作

IT之家 浏览 1313

先L3还是直接L4?国内车企还在争论,特斯拉已经“空车”上路了

Autolab 浏览 1255

冲击330万目标!尹同跃再“吹牛”:AI追赶特斯拉,推17款AI车

明镜pro 浏览 927

鲁比奥宣布任命新任美"西藏特别事务协调员" 中方回应

扬子晚报 浏览 1777

以后请叫甄子丹为超级丹

港剧叔 浏览 2064

美股多板块盘中集体重挫,一份假想AI报告引发的抛售潮

华尔街见闻官方 浏览 558

女人过了60岁也别放弃变美!冬季看看这些穿搭,得体又大方

静儿时尚达人 浏览 1283

王中磊夫妇转战短视频,影视一哥到底怎么了?

BT财经 浏览 1438

热度破9000,赵丽颖谭松韵令观众成功入坑,这部年底压轴剧太生猛

娱乐圈笔娱君 浏览 1143

星海T5预售解析:10万级全场景SUV务实主义答卷

众车网 浏览 1225
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1