关闭广告

上海AI实验室开源书生万亿科学大模型Intern-S1-Pro

IT之家1456人阅读

IT之家 2 月 4 日消息,上海 AI 实验室今日(2 月 4 日)宣布开源基于“通专融合”技术架构 SAGE 打造的万亿参数科学多模态大模型 Intern-S1-Pro


上海 AI 实验室表示,作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro 的核心科学能力实现了跃升,高难度综合学科评测稳居 AI4S 领域国际领先水平,复杂数理逻辑推理能力达奥赛金牌水平,面向真实科研流程的智能体能力位居开源模型第一梯队。


该模型基于混合专家架构(MoE),共拥有 512 个专家,总参数达 1T,每次调用仅激活 8 个专家、22B 参数。其通用能力和科学能力协同演进,并在底层架构实现了两大核心突破:

  • 在 SAGE 的基础模型层,通过引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉”;
  • 通过高效路由机制,系统攻克了训练万亿参数 MoE 模型在稳定性与算力效率上的瓶颈,为超大规模模型的训练提供了工程基础。

与此同时,Intern-S1-Pro 验证了从原创模型架构到国产算力基座自主技术的完整链路,为构建开放共享的 AGI4S 基础设施奠定了底座。

IT之家附 Intern-S1-Pro 开源地址如下:

  • 在线体验链接:https://chat.intern-ai.org.cn/
  • GitHub 链接:https://github.com/InternLM/Intern-S1
  • HuggingFace 链接:https://huggingface.co/internlm/Intern-S1-Pro
  • ModelScope 链接:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/Intern-S1-Pro
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

金银同创历史新高,国内金饰克价突破1180元,现在还是追高时机吗?

澎湃新闻 浏览 2545

不露腿也想穿好看,最关键的是这一点

黎贝卡的异想世界 浏览 1570

配激光雷达+磁悬浮底盘,深蓝L06将于11月18日上市

隔壁说车老王 浏览 2232

张柏芝仅用一招就让自己口碑暴增?

娱乐圈笔娱君 浏览 2367

苹果的大屏可折叠 iPad 可能因开发问题而延期到 2029 年

威锋网 浏览 2276

时隔十年上证指数重返3900点 四季度A股“开门红”

商业观察杂志社 浏览 2610

美国政府宣布美英就药品定价达成原则性协议

华尔街见闻官方 浏览 1877

美媒:美方提出的28点新计划已缩减为19点

极目新闻 浏览 7904

“欺诈重整第一股”现形,股民被蒙在鼓里数月,证监会下最后通牒

壹只灰鸽子 浏览 1789

知名折扣店好特卖被指大量闭店 曾4年开960家

每日经济新闻 浏览 6400

多家房企称已不被要求上报三道红线 仍需提交资产负债率指标

财联社 浏览 1525

斯基拉:前米兰队长卡拉布里亚想回意甲,索要200万欧年薪

懂球帝 浏览 1635

文班亚马新赛季满血回归 马刺是最被低估球队?

体坛周报 浏览 2363

马杜罗受审 委内瑞拉前情报主管或成美政府"关键证人"

环球网资讯 浏览 6042

左脚低射破门,加纳乔成为切尔西队史第6位进球的阿根廷球员

懂球帝 浏览 2304

二手平台现999999元出售"黄仁勋签名红包" 被商户打假

极目新闻 浏览 5389

泰国使用F-16战斗机对多个地点进行空袭 柬埔寨谴责

新京报 浏览 1918

限量30台 仰望U9X将于广州车展亮相

车质网 浏览 2107

大盘五连涨!今年3次五连涨后发生了什么?

每日经济新闻 浏览 1903

“内鬼”赶走老板!300多亿中国资产,要被抢了

大猫财经Pro 浏览 2650

活塞125-107大胜篮网豪取5连胜,坎宁安34+10,杜伦30分

懂球帝 浏览 2148
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1