(相关资料图)
近日,字节跳动 Seed 团队推出新一代形式化数学推理专用模型Seed Prover 1.5 ,通过大规模的Agentic RL训练,其推理能力和推理效率取得显著进步。相比上一代模型,Seed Prover 1.5在16.5小时内,针对 IMO 2025的前5道题目生成了完整可编译验证的 Lean 证明代码,换算成绩为35/42,达到此前 IMO 评分标准的金牌分数线。
针对北美本科级别数学竞赛 Putnam,Seed Prover 1.5用时9小时,对12道 Putnam 2025赛题中的11道生成了可编译验证的 Lean 代码。更系统的评估中,Seed Prover 1.5表现出色:它在完整的 Putnam 历史评估集上解决了88% 的问题,在代表硕士数学难度的 Fate-H 和代表博士生数学难度的 Fate-X 评估集上,分别解决了80% 和33% 的问题,刷新了形式化数学推理模型在这几个评测集上的 SOTA 表现。
Seed Prover 1.5 在多个评估集上与此前其他 SOTA 方法的比较
Seed Prover 1.5的技术报告已对外公开。后续将开放 API,邀请感兴趣的数学和 AI 研究者体验该模型。
字节推出形式化数学推理专用模型Seed Prover 1.5|今日精选
字节推出形式化数学推理专用模型SeedProver1 5,代码,seed,数学推理,prover
港股异动 | 佰泽医疗(02609)一度跌超4% 股价创上市新低 今日迎基石解禁-头条焦点
智通财经APP获悉,佰泽医疗(02609)今早盘初一度挫逾4%,低见4 11港元创
河北“算力走廊”加速崛起|焦点日报
图为邢台太行智算中心机房。(受访者供图)2025中国算力大会发布的数据
博纳影业(001330.SZ):相关合作授予公司《阿凡达3》的投资收益权比例较低,对短期...
格隆汇12月23日丨博纳影业(001330 SZ)公布股票交易异常波动公告,公司
停电致美国标准时间出现4.8微秒误差 报资讯
新华社洛杉矶12月22日电(记者黄恒)据美国媒体22日报道,科罗拉多州受
微动态丨国家金融监督管理总局许昌监管分局核准齐彬禹州市农村信用合作联社理事
2025年12月18日,国家金融监督管理总局许昌监管分局核准齐彬禹州市农村
上海图书馆:网络上关于本馆拍卖翁氏藏书并牟利的说法纯属谣言-今日视点
12月22日,上海图书馆发布声明:近...
日联科技:截至2025年12月20日公司股东户数为9257户
证券日报网讯12月22日,日联科技在...
[快讯]天马科技发布质押公告一股东累计质押7291万股|报资讯
CFi CN讯: 天马科技(股票代...
福安药业子公司收到盐酸曲唑酮片药品注册证书_新资讯
福安药业(300194)(300194 SZ)发...