关闭广告

上海AI实验室开源书生万亿科学大模型Intern-S1-Pro

IT之家1457人阅读

IT之家 2 月 4 日消息,上海 AI 实验室今日(2 月 4 日)宣布开源基于“通专融合”技术架构 SAGE 打造的万亿参数科学多模态大模型 Intern-S1-Pro


上海 AI 实验室表示,作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro 的核心科学能力实现了跃升,高难度综合学科评测稳居 AI4S 领域国际领先水平,复杂数理逻辑推理能力达奥赛金牌水平,面向真实科研流程的智能体能力位居开源模型第一梯队。


该模型基于混合专家架构(MoE),共拥有 512 个专家,总参数达 1T,每次调用仅激活 8 个专家、22B 参数。其通用能力和科学能力协同演进,并在底层架构实现了两大核心突破:

  • 在 SAGE 的基础模型层,通过引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉”;
  • 通过高效路由机制,系统攻克了训练万亿参数 MoE 模型在稳定性与算力效率上的瓶颈,为超大规模模型的训练提供了工程基础。

与此同时,Intern-S1-Pro 验证了从原创模型架构到国产算力基座自主技术的完整链路,为构建开放共享的 AGI4S 基础设施奠定了底座。

IT之家附 Intern-S1-Pro 开源地址如下:

  • 在线体验链接:https://chat.intern-ai.org.cn/
  • GitHub 链接:https://github.com/InternLM/Intern-S1
  • HuggingFace 链接:https://huggingface.co/internlm/Intern-S1-Pro
  • ModelScope 链接:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/Intern-S1-Pro
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

智驾研发迎分水岭?小鹏第二代VLA直奔L4, 何小鹏:完全自动驾驶将在未来1-3年内完全到来

时代财经 浏览 1207

美军连扣两艘油轮 美方:都是委内瑞拉“影子舰队”

新华社 浏览 1664

线下活动|| 在广州的春天里见个面吧

黎贝卡的异想世界 浏览 916

比大衣更高级,比羽绒服更时髦?它才是今年冬天最火的外套!

LinkFashion 浏览 1745

今年秋天最流行“卡其色穿搭”,谁穿谁好看!

LinkFashion 浏览 2588

澳海滩枪击惊魂50分钟:枪手占据天桥向下扫射

澎湃新闻 浏览 6817

德切利:尤文永远是我的家,我40年人生中有30年都在尤文

懂球帝 浏览 387

美媒称沙特强烈游说特朗普对伊朗动手 沙特坚决否认

环球时报国际 浏览 4048

新款享界S9将于11月7日正式开启预订

车质网 浏览 2089

美称空袭叙利亚西北部 打死一名与“基地”组织关联头目

新华社 浏览 1652

专访顶新便利餐饮 游仁宏:便利店的核心壁垒,是人与温度

新零售财经 浏览 2660

高市早苗曾叫嚣台湾有事日本必入

极目新闻 浏览 2338

《逍遥》最大谜团:村民献祭妹妹给树妖,为何秉烛只恨妖不恨人?

肆季娱乐 浏览 1812

美股三大股指集体收跌 人工智能概念股持续遭抛售

中新经纬 浏览 1918

市民举报3600平违建存续8年 官方:违建人患病不能强拆

扬子晚报 浏览 5648

3岁男童掉进炭火堆全身85%烧伤 母亲将手伸进白灰救娃

环球网资讯 浏览 10170

上海贵酒遭遇釜底抽薪

斑马消费 浏览 2542

奖金1.5万元,破赛事新纪录,张水华拿下2026年第一个冠军

数字财经智库 浏览 1836

德国就"夺岛"发声:国际法原则适用所有国家 包括美国

澎湃新闻 浏览 5875

殷桃|每个表情都让人欲罢不能

农城浪子 浏览 1656

阿里主动加码外卖大战,谁能笑到最后?

陆玖商业评论 浏览 1718
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1