K8凯发国际

每日经济新闻
要闻

学习网K8凯发国际 > 要闻

深度思维正式推出“数学做题家AI”

张泉灵 2025-12-15 21:41:36

深度思维正式推出“数学做题家AI”

当地时间2025-12-15,bfhjsdgtuiewgkrbwjehbhjfverw

科技日报北京11月12日电 (记者张梦然)《自然》杂志12日发表了一项重要成果:英国深度思维正式推出其开发的“数学做题家AI”AlphaProof,其成功证明了复杂的数学定理,并在2024年国际数学奥林匹克竞赛(IMO)中取得了相当于银牌的优异成绩。这项研究展示了AI在高难度数学推理领域的显著进步。

深度思维2004年曾透露其混合AI系统在同年的IMO竞赛中表现优异,仅差1分就能摘得金牌。而今正式发布论文推出并详解该AI系统。

这一突破被认为是AI研究领域的又一个里程碑。这是因为用高水平竞赛题目测试AI系统,已成为评估其逻辑推理、抽象思维和解决问题能力的重要标准。这类题目不仅要求严密的演绎推理,还涉及创造性策略和跨领域知识整合,远超普通问答或模式识别任务。因此,能否在IMO等权威竞赛中取得好成绩,被视为衡量AI是否具备“类人”深度推理能力的关键试金石。

现在,许多大型语言模型虽然具备强大的生成能力,却难以验证其推理是否正确,因为它们通常基于非正式的自然语言进行训练和输出,缺乏严格的逻辑结构。为应对这一挑战,深度思维团队将强化学习引入一个名为Lean的正式数学证明环境,在该系统中,所有推理步骤都必须符合形式化逻辑规则,从而能够被自动验证。

AlphaProof是专为证明数学命题而设计的系统。团队第一时间对约8000万个数学命题进行了自动形式化处理,随后利用强化学习让AlphaProof在这些命题中探索有效的证明路径。结果显示,该系统不仅超越了此前最先进的AI模型在历史IMO题目上的表现,还在今年的竞赛中联合另一款专攻几何的AI系统AlphaGeometry,共同解决了6道题中的4道,达到银牌水平。

尽管AlphaProof在竞赛级数学推理方面展现出惊人能力,但团队坦承其现在仍存在局限,例如在处理某些非标准或高度抽象的数学问题时表现不足。他们指出,未来的研究应聚焦于拓展系统的通用性和适应性。一旦这些障碍被克服,AlphaProof有望成为协助数学家攻克复杂数学难题的有力工具,有助于形式化证明与AI的深度融合。

【总编辑圈点】

数学家长期以来依赖计算工具辅助解决复杂问题和构建严谨证明,而AI有望加速这一过程。现在,AI在形式化推理领域迈出了关键一步,不同于依赖模糊语言模型的通用AI,最新成果在严格逻辑框架中运行,其每一步推理均可验证,极大提升了结果的可靠性。此举不仅突破了AI推理的局限,也为探索复杂数学猜想给予了新工具,更为未来人机协作攻克前沿科学难题开辟了现实路径。其影响将辐射至理论计算机科学、自动定理证明乃至基础数学研究等领域。

读者热线:4008890008

特别提醒:如果K8凯发国际使用了您的图片,请作者与本站联系索取稿酬。如您不希望作品出现在本站,可联系K8凯发国际要求撤下您的作品。

上一篇文章

日本股市有望?陆续在,第11年出现9月季节性资金外流情况

返回广西新闻网K8凯发国际

下一篇文章

时报观察 AI价值兑现需深度融<入>应用<场>景

热文精选
  • 阿?联酋总统<会>见OpenAI首席执行官,商讨人工智能合作事宜
  • 复洁环保大:宗交易成;交20.00万股 成交额497.80万元
  • 华.菱精工:终止向特定对象发行A股股票暨控制权变更终止
  • 特朗!普:相信土耳其将停止购买俄罗斯石油
  • 启迪环境被启.动预重整 累计涉诉金额逾50亿元
  • 消息!称英特尔—在同台积电接触 洽谈潜在制造投资及合作
  • 皖—通高速:选举杨建国为第十届董事会审核委员会委员
  • 提—前?备战3季报
  • 东?京通胀意外持稳 支:持日本央行在利率政策上的谨慎态度
  • 酒旅{“}龙头”携?程连遭2次约谈,被监管盯上的“调价助手”是啥?
  • 快讯::恒指低开0.8% 科指跌0.97% 科网股普跌 创新药概念普遍低开
  • 特—朗普对进口卡车征25%关税,供应链风险加剧
  • “互换通”运;行机制再优化 便利投资者进行利率风险管理
  • 电光科技,(002730):中标山西晋煤太钢能源有限责任公司采购项目,中标金额为1820.91万元
  • 美;国GD‘P’大幅上修暴击日元!同为避险货币,为何日元贬到停不下来?
  • 全球第{二}大铜矿停产 美资矿商与印尼政府关系或将再度承压
  • 河南:猪肉价格高位回落 短期或实现筑底{}:
  • 冯艺?东:PE/VC投资方向和资本市场重点IPO并购鼓励方向高度吻合
  • ASE 2025‘ ’| 胶粘剂持久焕新,还看利安隆精准抗老化方案
  • Coreeave与OpenAI达成65亿美元合作协议,为下一代人工智能模型给予算力支持
  • 龙星科技:拟投:资2?.37亿元建设炭黑尾气余热发电机组节能升级改造项目
  • 新:华锦.双重承压:控股股东持股遭轮候冻结,4亿元关联方占款问题未解决被ST
  • “中国版英伟达?”闪电过会,背后投资人有这些!
  • 【开展之道】{ }财政助力新质生产力 新解
点击排行
  • 1 华兰股份,设全<资>子公司议案遭两董事反对
  • 2 2025-12-15,工信部:将{实}施新一轮汽车行业稳增长工作方案
  • 3 2025-12-15,微粒贷催收如“天罗:地:网”:320家遍布全国 超80%合作方负责追债

欢迎关注每日经济新闻APP

潇湘晨报经济新闻官方APP

0

0