AI 数学推理新王:英伟达发布两款 OpenMath-Nemotron 模型

人脑网 4 月 25 日消息,科技媒体 marktechpost 今天(4 月 25 日)发布博文,报道称英伟达专为数学推理设计,发布 OpenMath-Nemotron-32B 和 OpenMath-Nemotron-14B-Kaggle 两款先进 AI 模型。

数学推理一直是 AI 领域的巨大挑战。传统的语言模型擅长生成流畅文本,却在解决复杂数学问题时显得力不从心,这些问题不仅需要理解抽象概念,还要求多步骤的逻辑推导。

人脑网援引博文介绍,英伟达针对这一难题,推出了 OpenMath-Nemotron-32B 和 OpenMath-Nemotron-14B-Kaggle 两款模型,基于 Qwen 系列 transformer 模型,通过在 OpenMathReasoning 数据集上的深度微调,显著提升了数学推理能力。

OpenMath-Nemotron-32B 是系列中的旗舰产品,拥有 328 亿参数,采用 BF16 张量运算优化硬件效率。该模型在 AIME 2024、AIME 2025、HMMT 2024-25 等多项基准测试中取得领先成绩。

以工具集成推理(TIR)模式为例,其在 AIME24 上的 pass@1 准确率达到 78.4%,通过多数投票机制更是提升至 93.3%。

AI 数学推理新王:英伟达发布两款 OpenMath-Nemotron 模型

此外,模型支持链式思维(CoT)、工具集成推理(TIR)和生成式选择(GenSelect)三种模式,用户可根据需求平衡推理透明度和答案精确度,满足科研和生产环境的不同场景。

OpenMath-Nemotron-14B-Kaggle 是一款 148 亿参数的轻量模型,针对 AIMO-2 Kaggle 竞赛优化设计,通过精选 OpenMathReasoning 数据集子集进行微调,成功夺得竞赛第一名。

在 AIME24 测试中,其 CoT 模式下 pass@1 准确率为 73.7%,GenSelect 模式下提升至 86.7%。这款模型参数更少,保持高质量的数学解题能力的同时,适合资源受限或低延迟需求的场景。

英伟达为两款模型提供了开源管道,集成于 NeMo-Skills 框架中,支持数据生成、训练和评估的全流程复现。开发者可通过示例代码快速构建应用,获取逐步解答或简洁答案。

模型针对 NVIDIA GPU(如 Ampere 和 Hopper 架构)深度优化,利用 CUDA 库和 TensorRT 技术,确保高效运行。同时,采用 Triton Inference Server 支持低延迟、高吞吐量的部署,BF16 格式则在内存占用与性能间取得平衡,助力大规模应用落地。

主题测试文章,只做测试使用。发布者:人脑网,转转请注明出处:https://www.rennao.com.cn/8179.html

(0)
人脑网的头像人脑网
上一篇 2025年4月25日 下午3:18
下一篇 2025年4月25日 下午3:19

相关推荐

  • 一加磁吸能量卡 Air 雪王版 6 月 17 日发售,149 元

    人脑网 6 月 15 日消息,一加手机今日宣布,一加磁吸能量卡 Air 雪王版将于 6 月 17 日 20:00 在 OPPO 商城独家发售,现已开启预约,售价 149 元。 一加磁吸能量卡 Air 雪王版基于 OPPO 磁吸能量卡 Air 打造,容量为 5000mAh,兼容 OPPO Mag 磁吸生态,支持苹果、安卓平台磁吸无线充电,USB-C 接口兼容 …

    2025年6月15日
    400
  • 10个 NAS 9个吃灰 买完NAS你后悔不?

    【ZOL人脑网原创技术解析】最近,“NAS是不是智商税”的话题又在网络上掀起波澜。不少人吐槽,自己当初冲动入手的NAS,如今已沦为家中的“电子摆件”,10个里面有9 个吃灰。但也有部分用户表示,NAS早已成为他们生活中不可或缺的“数字管家”。那么,对于普通大众来说,NAS到底是提升生活品质的神器,还是一个被过度炒作的智商税产品?今天,咱们就来好好唠唠。 NA…

    2025年5月10日
    1300
  • 5分钟看懂夜景人像神器 OPPO Find X8 Ultra

    还在为夜晚拍不出满意的人像照片而烦恼?刚刚发布的OPPO Find X8 Ultra了解下。这台手机专为解决夜景人像拍摄难题而生,让你轻松成为朋友圈里的摄影大神。接下来,花5分钟时间,带你深入了解这款夜景人像神器。 手机想要拍好夜景照片,需要两大要素,其一是出色的硬件配置,因为夜晚光线条件很差,需要更大的传感器才能捕捉更多的进光量,保留更丰富的细节。OPPO…

    2025年4月11日
    4300
  • 诺基亚宣布主导欧盟 PROACTIF 项目,开发应急管理无人机系统

    人脑网 6 月 7 日消息,诺基亚宣布将主导由欧盟资助的“PROACTIF”项目,开发一系列用于应急管理、公共安全的无人机,相应项目汇集了来自 13 个国家的 42 家机构,其中包括英伟达、Leonardo等公司。 据悉,此次 PROACTIF 项目由欧盟“芯片联合计划”(Chips Joint Undertaking,简称Chips JU)提供资金支持,这…

    2025年6月7日
    900
  • 冲破次元壁!华硕天选联名初音未来梦幻新品亮相2025新品发布会

    4月12日,ROG玩家国度在长沙市远大城金字塔盛大举办了2025ROG DAY活动,玩家们热情响应,从全国各地纷纷来到现场,参与精彩纷呈的活动,体验各种高性能电竞装备。而在此次ROGDAY活动现场,更是为各位玩家带来了一场别开生面的ROGLAB灵感实验室”冲破次元壁”新品发布会。 华硕电脑开放平台中国区总经理俞元麟化身实验室社长,带领虚拟实验室社员及现场共创…

    2025年4月13日
    3100

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信