打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力

不再像CoT(“思维链”)一样“一个字一个字往外蹦”,加上“软思维”就能让大模型像人类一样进行抽象思考。

来自SimularAI和微软DeepSpeed的研究员联合提出了Soft Thinking,让模型在连续的概念空间中进行 “软推理”,而非局限于离散的语言符号,打破了基于离散token的推理瓶颈。

相比标准CoT,Soft Thinking最高提升Pass@1平均准确率2.48%、减少token使用量22.4%。

并且,Soft Thinking是一种即插即用的推理策略,无需额外训练即可应用于现有模型(如Llama、Qwen)。

打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力

目前主流的语言模型推理方法存在一个关键问题:只能逐字生成离散的语言符号(如单词或子词)

这就好比思考时只能一个字一个字的蹦出来,不仅限制了模型表达抽象概念的能力,还容易在复杂问题中因“单一路径选择”而犯错。

人类大脑思考时并非依赖明确的语言符号,而是通过抽象概念的灵活整合进行推理。

打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力

Soft Thinking正是受此启发,将语言模型的推理从“离散符号空间”拓展到“连续概念空间”。

这样,模型就可以捕捉到介于仅有细微差别的语义之间的概念,能够更灵活地探索多种解题路径,同时保持高效和可解释性。

有网友表示:这种方法解决了自回归“贪婪”的next token搜索问题。

打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力

如何让模型像人类一样进行抽象思考
推理流程:在连续概念空间中 “软推理”

Soft Thinking仅修改传统CoT的中间推理阶段,保留最终答案的离散生成(如数学题的数字答案或代码的具体语句)。

Soft Thinking的理论本质是线性近似替代路径枚举

解复杂问题时,传统CoT的推理路径数量随步骤呈指数级增长(如每步选1000个token,3步就有1000^3种路径),无法显式枚举。

Soft Thinking通过线性化近似,将指数级路径求和简化为概念token的加权计算。

概率加权替代离散采样,通过连续概念空间中的线性变换,隐式聚合多条路径的信息,避免显式枚举的计算爆炸。

打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力

概念token:用概率分布代替单一符号

传统方法每次生成一个确定的token(如 “30”“加”),而Soft Thinking生成一个概率分布(如 “30” 的概率40%,“乘以” 的概率30%,“分解” 的概率20%等),这个分布被称为 “概念token”。

每个概念token相当于多个可能符号的 “混合体”,允许模型同时保留多种推理可能性

如下图中的例子,在计算“43×34”时,模型可能同时考虑“分解34为30+4”和“直接相乘”两种路径的概率,而非只选其一。

打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力

连续概念空间:在 “模糊” 的语义空间中推理

通过将概念token的概率分布与模型的词向量(Token Embedding)加权结合,形成连续的概念空间。

这里的 “连续” 意味着模型可以在不同概念之间平滑过渡,例如从“分解数字”自然过渡到“乘法运算”,而无需用明确的语言符号分隔步骤。

打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力

Cold Stop机制:避免无效循环

由于模型在训练中没见过概念token(属于 “分布外” 输入),长时间推理可能导致陷入重复或混乱(类似人类思维的 “卡壳”)。

Soft Thinking引入了一个“Cold Stop”机制:通过监测概率分布的熵值判断模型的 “自信程度”。

当熵值持续较低时(表明模型对当前推理路径很确定),提前终止中间步骤,直接生成答案,避免浪费计算资源。

测试结果及对比

在基准测试里,QwQ – 32B模型的平均Pass@1准确率从标准CoT的83.84%提升至86.32%,最高提升2.48%,其中在AIME 2024数据集上提升6.45%。

推理效率方面,DeepSeek-R1-Distill-Qwen-32B在数学任务中token使用量减少22.4%。

打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力

与其他方法的对比
  • COCONUT-TF(无训练):直接使用隐藏状态作为输入,完全失败,生成长度达最大值且无正确解。
  • 平均嵌入策略:仅计算top-5 token均值,准确率低且生成长度长(如AIME 2024仅6.66%正确)。

打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力

Soft Thinking通过连续概念空间推理和Cold Stop机制智能平衡了效率与准确性,为大模型优化提供了新思路。

感兴趣的朋友可以到官方了解更多细节。

官方网站:https://soft-thinking.github.io/
论文地址:https://arxiv.org/abs/2505.15778
代码地址:https://github.com/eric-ai-lab/Soft-Thinking
参考链接:https://x.com/xwang_lk/status/1925399783503798692

主题测试文章,只做测试使用。发布者:人脑网,转转请注明出处:https://www.rennao.com.cn/16380.html

(0)
人脑网的头像人脑网
上一篇 2025年5月24日 下午3:30
下一篇 2025年5月24日 下午3:32

相关推荐

  • AI项链?OpenAI首款硬件爆料,乔布斯爱将操刀

    OpenAI和强纳肾合作首发AI硬件,很可能是——项链?! 才官宣合作没多久,就被知名苹果分析师郭明錤重磅爆料: 奥特曼甚至已经抢先体验到了原型机,大致形态可能长这样: 预期用法是可以戴在脖子上,显示屏NO,但内置摄像头和麦克风YES。 嘶!听起来怎么有些熟悉?有网友说,这不就是iPod Shuffle挂根绳? 看来出走老东家苹果多年,Jony Ive和奥特…

    2025年5月24日
    700
  • 华为+DeepSeek,推理性能创新高!技术报告也公布出来了

    部署超大规模MoE这件事,国产芯片的推理性能,已经再创新高了—— 不仅是“英伟达含量为0”这么简单,更是性能全面超越英伟达Hopper架构! 而做到这一点的,正是华为昇腾;具体而言,共包含两个产品: CloudMatrix 384超节点 部署DeepSeek V3/R1,在50ms时延约束下单卡Decode吞吐突破1920 Tokens/s Atlas 80…

    2025年5月19日
    800
  • 电视装了智能体,只凭台词就能找到剧集了

    AI智能体,已经被装进了电视。 只要描述想看的情节,电视就能自动帮你找到相应的影视作品,不知道剧名也没关系。 还能帮你规划旅游行程,在大屏幕上更清晰地显示推荐的景点、美食和机酒。 这两个场景,背后都是互联网电视企业酷开科技最新发布的AI智能体。 除了影音和生活之外,还有教育、健康、创作和设备四款智能体也同台亮相,并在酷开接下来的电视、闺蜜机、学习机等新产品中…

    2025年4月24日
    2400
  • 搜索SEO被AI重塑,专业内容社区价值凸显 | 量子位智库报告

    大模型颠覆传统搜索的风,已经吹到了商业化策略的层面。 量子位智库最新报告发现: AI智能助手替代搜索的过程中,传统SEO也正在被重构。 SEO(Search Engine Optimization),即搜索引擎优化,是指通过优化网站和内容,来提高其在搜索引擎中自然排名,从而吸引更多流量的方法和策略。 可以说,在互联网时代,SEO是搜索商业化环节中最基础、最重…

    2025年5月21日
    1400
  • 火山引擎发布豆包视频生成模型Seedance 1.0 lite

    5月13日,在 FORCE LINK AI 创新巡展·上海站,火山引擎发布豆包·视频生成模型 Seedance 1.0 lite、豆包1.5·视觉深度思考模型,并升级豆包·音乐模型,以更全面的模型矩阵、更丰富的智能体工具,帮助企业打通从业务到智能体的应用链路。 豆包·视频生成模型Seedance 1.0 lite:效果好、生成快、更便宜 此次全新发布的豆包视…

    2025年5月14日
    700

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信