AI 数学推理新王:英伟达发布两款 OpenMath-Nemotron 模型

人脑网 4 月 25 日消息,科技媒体 marktechpost 今天(4 月 25 日)发布博文,报道称英伟达专为数学推理设计,发布 OpenMath-Nemotron-32B 和 OpenMath-Nemotron-14B-Kaggle 两款先进 AI 模型。

数学推理一直是 AI 领域的巨大挑战。传统的语言模型擅长生成流畅文本,却在解决复杂数学问题时显得力不从心,这些问题不仅需要理解抽象概念,还要求多步骤的逻辑推导。

人脑网援引博文介绍,英伟达针对这一难题,推出了 OpenMath-Nemotron-32B 和 OpenMath-Nemotron-14B-Kaggle 两款模型,基于 Qwen 系列 transformer 模型,通过在 OpenMathReasoning 数据集上的深度微调,显著提升了数学推理能力。

OpenMath-Nemotron-32B 是系列中的旗舰产品,拥有 328 亿参数,采用 BF16 张量运算优化硬件效率。该模型在 AIME 2024、AIME 2025、HMMT 2024-25 等多项基准测试中取得领先成绩。

以工具集成推理(TIR)模式为例,其在 AIME24 上的 pass@1 准确率达到 78.4%,通过多数投票机制更是提升至 93.3%。

AI 数学推理新王:英伟达发布两款 OpenMath-Nemotron 模型

此外,模型支持链式思维(CoT)、工具集成推理(TIR)和生成式选择(GenSelect)三种模式,用户可根据需求平衡推理透明度和答案精确度,满足科研和生产环境的不同场景。

OpenMath-Nemotron-14B-Kaggle 是一款 148 亿参数的轻量模型,针对 AIMO-2 Kaggle 竞赛优化设计,通过精选 OpenMathReasoning 数据集子集进行微调,成功夺得竞赛第一名。

在 AIME24 测试中,其 CoT 模式下 pass@1 准确率为 73.7%,GenSelect 模式下提升至 86.7%。这款模型参数更少,保持高质量的数学解题能力的同时,适合资源受限或低延迟需求的场景。

英伟达为两款模型提供了开源管道,集成于 NeMo-Skills 框架中,支持数据生成、训练和评估的全流程复现。开发者可通过示例代码快速构建应用,获取逐步解答或简洁答案。

模型针对 NVIDIA GPU(如 Ampere 和 Hopper 架构)深度优化,利用 CUDA 库和 TensorRT 技术,确保高效运行。同时,采用 Triton Inference Server 支持低延迟、高吞吐量的部署,BF16 格式则在内存占用与性能间取得平衡,助力大规模应用落地。

主题测试文章,只做测试使用。发布者:人脑网,转转请注明出处:https://www.rennao.com.cn/8179.html

(0)
人脑网的头像人脑网
上一篇 2025年4月25日 下午3:18
下一篇 2025年4月25日 下午3:19

相关推荐

  • 打印机的这些功能还不知道 相当于白买

    【ZOL人脑网原创技巧应用】无论是校园里的莘莘学子,还是职场中的办公族,打印机早已融入我们的日常生活。学生用它打印复习资料、论文文档。职场人依靠它处理发票、合同、报告等各类文件。在追求高效办公的当下,打印机的一些实用功能显得尤为重要,不仅能节省时间,还能提升工作效率。今天,就为大家梳理那些用过就离不开的宝藏打印机功能,看看它们是如何让打印工作变得更加轻松便捷…

    2025年4月26日
    600
  • 谷歌 DeepMind 推 QuestBench 基准,测试 AI 模型的“补漏”能力

    人脑网 4 月 26 日消息,科技媒体 marktechpost 昨日(4 月 25 日)发布博文,报道称谷歌 DeepMind 团队推出 QuestBench 新基准,通过约束满足问题(CSPs)框架,评估模型在推理任务中识别和获取缺失信息的能力。 现实挑战与信息获取需求 大型语言模型(LLMs)在推理任务中广受关注,涵盖数学、逻辑、规划和编码等领域。然而…

    2025年4月26日
    600
  • iQOO Z10 Turbo Pro 通过《和平精英》120 帧送测,预计 5 月生效

    人脑网 4 月 27 日消息,iQOO Z 系列产品经理邢程今日发文称:“iQOO Z10 Turbo Pro 手机通过《和平精英》120 帧送测,,等游戏方版本更新即可体验,预计 5 月内生效。” 邢程表示,“行业目前只有真旗舰处理器的性能能支撑这么高的负载。这也代表,行业内目前所有 8s Gen4 机型,只有 iQOO 能玩和平 120 帧。” 据人脑网…

    2025年4月27日
    700
  • 锐龙9 9955HX3D+RTX 5070 Ti王炸组合!ROG魔霸9首测

    【ZOL人脑网原创评测】2025年我个人最期待,相信也是全网游戏玩家、硬件发烧友们最期待的AMD锐龙9 9955H3XD版ROG魔霸9终于来了,这也是AMD时隔大约2年后再次推出的移动端X3D处理器。 作为AMD锐龙平台在游戏产品线上推出的“核武器级”产品,X3D系列深受游戏玩家喜爱。它以超大缓存容量的设计换来超高游戏帧数、尤其是LOW帧表现极为惊艳,堪称游…

    2025年4月28日
    500
  • 能打电话的“V 单” vivo X200 Ultra全渠道首销 预购量同比增48%

    4月29日,vivo年度影像旗舰X200 Ultra正式迎来全渠道首销。自4月21日预售启动以来,这款有着“全能V单”之称的创新影像产品已展现出惊人的市场号召力——预售首日,累计销量就达到上一代X100 Ultra同比的148%。这一数据不仅刷新了vivo高端机型的历史纪录,更释放出一个明确信号:在手机行业和移动影像整体“内卷”加剧的当下,用户对“全焦段无短…

    2025年4月29日
    400

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信