关闭广告

上海AI实验室开源书生万亿科学大模型Intern-S1-Pro

IT之家824人阅读

IT之家 2 月 4 日消息,上海 AI 实验室今日(2 月 4 日)宣布开源基于“通专融合”技术架构 SAGE 打造的万亿参数科学多模态大模型 Intern-S1-Pro


上海 AI 实验室表示,作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro 的核心科学能力实现了跃升,高难度综合学科评测稳居 AI4S 领域国际领先水平,复杂数理逻辑推理能力达奥赛金牌水平,面向真实科研流程的智能体能力位居开源模型第一梯队。


该模型基于混合专家架构(MoE),共拥有 512 个专家,总参数达 1T,每次调用仅激活 8 个专家、22B 参数。其通用能力和科学能力协同演进,并在底层架构实现了两大核心突破:

  • 在 SAGE 的基础模型层,通过引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉”;
  • 通过高效路由机制,系统攻克了训练万亿参数 MoE 模型在稳定性与算力效率上的瓶颈,为超大规模模型的训练提供了工程基础。

与此同时,Intern-S1-Pro 验证了从原创模型架构到国产算力基座自主技术的完整链路,为构建开放共享的 AGI4S 基础设施奠定了底座。

IT之家附 Intern-S1-Pro 开源地址如下:

  • 在线体验链接:https://chat.intern-ai.org.cn/
  • GitHub 链接:https://github.com/InternLM/Intern-S1
  • HuggingFace 链接:https://huggingface.co/internlm/Intern-S1-Pro
  • ModelScope 链接:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/Intern-S1-Pro
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今年冬天一定要有“格纹单品”,复古又时髦

LinkFashion 浏览 1368

五旬老人上综艺,有时候比年轻人更有看点。

伊周潮流 浏览 1940

U23国足战越南官方阵型: 4-4-2!鲍盛鑫中场,蒯纪闻搭档向余望,胡荷韬可落位边后卫>>

懂球帝 浏览 1037

“毛绒外套”今年冬天爆火,这样穿又暖又时髦!

LinkFashion 浏览 1457

罗马市政府:已协调各方,力争年底前完成罗马新球场最终设计稿

懂球帝 浏览 1874

创新推出ACE SXFI蓝牙耳机,699元

IT之家 浏览 1253

王家卫持续被扒

萌神木木 浏览 1667

佘智江获利达1.5亿元:曾逼美貌女性卖淫 或供"玩乐"

新京报 浏览 5600

马塞洛:当年觉得皮克是个自以为是的蠢货,太烦人了

懂球帝 浏览 1956

日本前外相:高市言论"可能开启一条通往战争的道路"

参考消息 浏览 5500

一个时代审美的终结:美人何晴,温柔亦有筋骨

仙女事件簿 浏览 1381

新势力2月销量解读:青黄不接与厚积薄发

科技丛林 浏览 484

秦岚自曝身体出现情况,治疗结果不尽人意

乡野小珥 浏览 446

比亚迪唐9系旗舰SUV测试 要从BBA嘴里"抢肉吃"?

车矩阵更懂车 浏览 878

官方:原海港、深足康复师克雷顿加盟广州豹,能用汉语沟通

懂球帝 浏览 852

托辛:很荣幸在队内是资深球员;“叔叔”的外号来自马杜埃凯

懂球帝 浏览 1903

美方在北约外长会上"炮轰"欧盟 被指系又一次强硬姿态

澎湃新闻 浏览 5406

"花坛白骨案"告破:女老板遭谋杀 凶手"换脸"逃亡28年

封面新闻 浏览 3652

缅甸突袭KK园区后引发"招聘潮" 有人被7万美元"转卖"

红星新闻 浏览 6679

没想到,45岁隋俊波秒了25岁王影璐,她一直没火太可惜了

温柔娱公子 浏览 1804

吕丽君女儿正脸照罕曝光,犹如翻版刘銮雄!

娱乐团长 浏览 1270
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1