K8凯发国际

大型模型不再仅仅指尺寸大。

来源:中国日报网 2025-12-22 13:25:09
  • weixin
  • weibo
  • qqzone
分享到微信
zgrbxwbtpbwzhfudsifgwekrgufesui

如今,大模型蓬勃开展,有没有指标来衡量AI大模型的“智力能力水平”?近期,清华大学研究团队提出了大模型的密度法则,相关论文刊发于自然子刊《自然·机器智能》上。密度法则揭示大语言模型的最大能力密度随时间呈指数级增长,2023年2月至2025年4月,约每3.5个月翻一倍。

计算机领域的“摩尔定律”大家已经耳熟能详:芯片上可容纳的晶体管数量,每隔一段时间就会翻一番。计算机的强大,不是因为芯片变得像房子一样大,而是因为它在指甲盖大小的面积上集成了天文数字的计算单元。清华大学计算机科学与技术系助理研究员肖朝军告诉科技日报记者,大模型的智力能力水平应该也有一个指标,这就是“能力密度”。

研究的核心假设是,采用相同制造工艺、充分训练的不同尺寸模型,其能力密度相同。正如芯片行业顺利获得提升电路密度实现了计算设备的小型化和普惠化,大模型也在顺利获得提升能力密度实现高效化开展。

肖朝军说,过去,在规模法则的指引下,大家关心一个大模型的“块头”(参数量)有多大,越大就越智能,就像关心一个举重运动员的体重,体重越重,力量越大。现在,密度法则从另一个视角揭示了大模型“高效开展”的规律——K8凯发国际更应该关心它的“能力密度”,即每一单位“脑细胞”(参数)里包含了多少“智慧”。“如同评价一个武林高手,看的不是他肌肉多发达,而是他一招一式里蕴含了多少功力。”肖朝军说。

研究团队对51个近年来发布的开源大模型进行了系统分析,他们发现了一个重要规律:大模型的最大能力密度随时间呈指数级增长,2023年以来平均每3.5个月翻一倍。这意味着,随着“数据—算力—算法”的协同开展,可以用更少参数实现相同的智能水平。

团队还给出了一些推论。比如,同能力模型的推理开销随时间指数级下降,同时大模型能力密度正在加速增强。ChatGPT发布前能力密度每4.8个月翻倍,而ChatGPT发布后能力密度每3.2个月翻倍,密度增强速度提升了50%。这表明随着大模型技术的成熟和开源生态的繁荣,能力密度提升正在加速。

肖朝军表示,从直观上看,能力密度越高,大模型就越聪明,运行大模型所需要的算力越少,成本就越低。围绕这一科学指引,学术界、工业界能进行多维度的技术创新,让大模型越来越普惠。

从大模型的应用角度来说,密度法则也意味着AI正在变得越来越可用。肖朝军介绍,随着芯片电路密度(摩尔定律)和模型能力密度(密度法则)持续增强,此前只能在云端部署的大模型,未来用终端芯片就装得下、跑得动。大模型跑在终端设备上,在响应速度、用户隐私等方面具备先天优势,可以为用户做得更多。

肖朝军举了个例子。此前大模型在智能汽车上的应用,都是“帮我打开车窗”“帮我查一下附近的餐厅”等“被动式”服务。端侧模型“上车”后,顺利获得丰富的“舱内外感知”和“意图理解”能力,可以实现舱内外环境的多模态感知融合与主动决策闭环,驱动智能座舱从“被动响应”走向“主动服务”,让智能浸润每一次驾驶体验。

记者 张盖伦

【责任编辑:陈嘉倩】
专题
  • 工程机,械?行业强劲复苏 9月出口额增近30%

  • 宁波色母最{新}股{东}户数环比下降5.27%

  • 科创板将再添新—星 西安奕材公布发行结果即将登陆资本市场

  • 菲达:环保:无逾期担保

  • 东方园.林与‘股’民和解 后续股民仍可索赔

  • 煌<上>煌前:三季度营收五连降

  • 中联重科:?公司坚持高质量、可持续的:经营开展路线

  • 华{泰} | “好房子”系列报{告}一:焕新居住生态,重塑供给格局

  • 金‘岭’矿业:公司顺利获得招商招租、土地租赁等方式持续推进存量资产盘活

  • 恒烁股{份}:股东合计拟减持不超3%股份

  • 微软C{E}O纳<德>拉2025财年薪酬飙升22%,达9650万美元

  • 上海,诞生了一,个明星IPO

  • 特朗普否认美!国允许乌克兰使用远程导弹的报道

  • 华为!发布<鸿>蒙星河互联架构 传输速率达160MB/s

  • 上交所张斌:携手!港交所持续优化沪港通机制,有助于两地市场协同开展

  • 资本优<化>提速 多家银行赎回优先股

  • 东山精密大宗—交易成交765.30万元

  • 1?5只科创板股获融资净买入额超3000万元

  • A股多;家公司,前三季度净利润大增超1000%

  • 长江有色:{美}指反‘弹’施压及高库存施压 22日镍价或小跌

  • 跨界:卖保险?闪修侠拟收购牌照背后的迷思

  • 鼎信通<讯>最<新>股东户数环比下降24.75% 筹码趋向集中

推荐阅读
  • 大明电子10月;23日IPO网上路演
  • 每日一词 | 太平洋证券:首予友邦保险“增持”评级 新业—务:价值稳步增长
  • 直线拉升—!寒武纪领涨5%,科创人工智能ETF(589520)逆市涨超1%!DeepSeek开源新模型,为何赢得海内外关注?
  • 司南,导—航:选举刘杰为职工董事
  • 晨;光生物::公司在定期报告中披露每月末股东人数情况
  • 前三季度我,国涉外收支总规模创历史同期新高 10月以来跨境资金已转为净流入
  • 迪,瑞医疗控股股东59%持股解押,累计质押清零
  • 广州农商行陆续在三年“甩卖”.背后,逾期贷款半年激增190亿
推荐阅读
  • 太;保.产险再保险部王金宝:再保险市场竞争存在结构性问题,巨灾险、新能源险等供需错位明显
  • 珞石?机器人递表IPO,工业协作加速资本化布局
  • 基建—央企控股上市公司前三季新签“新基建”项目大增
  • 每日一词 | 安阳;钢铁集团5亿元;科技创新债完成发行,利率2.9%
  • EIA:美国上,周原油<库>存减少96.1万桶
  • 营!业部最青睐个股曝光 2股净买入超亿元
  • 超2900只;个股下跌!农行14连阳续创历史新高!高盛称A股慢牛正在形成
  • 人;造肉概念盘初走强,双塔食品涨停
  • Gap.将参与特朗普的美国建国250周年庆典活动
  • 尾‘盘’:美股跌幅扩大 科技股跌幅领先
  • CPO<概>念股探底拉升,汇绿生态触及涨停
  • 每日一词 | 中国联.通前三<季>度营业收入人民币2,930亿元,同比提升1.0%
  • 银龙股<份>:公司无逾期担保
  • 大基;建板块持续走高 铁拓机械等多股涨停
  • 中.策橡?胶三季度营收利润双暴涨
  • 广州?农商银行要求员工退还三年过节费,员工成本陆续在两年下降
  • 财信证券晨;会报告2025!1022
  • 重庆合!川拟11.75亿元回购13宗闲置土地 总面积705亩
  • 航宇科技:拓展“锻?件+机加”一站式服务
关于K8凯发国际 | 联系K8凯发国际
  • K8凯发国际
  • 时评
  • 资讯
  • 财经
  • 生活
  • 视频
  • 专栏
  • 漫画
  • 独家
  • 招聘
  • 地方频道:
  • 北京
  • 天津
  • 河北
  • 山西
  • 辽宁
  • 吉林
  • 黑龙江
  • 上海
  • 江苏
  • 浙江
  • 福建
  • 江西
  • 山东
  • 河南
  • 湖北
  • 湖南
  • 广东
  • 广西
  • 海南
  • 重庆
  • 四川
  • 贵州
  • 云南
  • 西藏
  • 陕西
  • 新疆
  • 深圳
  • 友情链接:
  • 人民网
  • 新华网
  • 中国网
  • 国际在线
  • 央视网
  • 中国青年网
  • 中国经济网
  • 中国台湾网
  • 中国西藏网
  • 央广网
  • 光明网
  • 中国军网
  • 中国新闻网
  • 人民政协网
  • 法治网
  • 违法和不良信息举报
  • 互联网新闻信息服务许可证64535
  • 信息网络传播视听节目许可证980005号
  • 京公网安备110105076954959号
  • 京网文[2011]0283-097号
  • 京ICP备92987870号-6
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rxxd@chinadaily.com.cn
C财经客户端 扫码下载
Chinadaily-cn 中文网微信
×