不用等R2了！第三方给新版DeepSeek V3添加深度思考

人脑网 • 2025年4月29日下午3:28 • 智能 • 阅读 7

DeepSeek即将发布R2？？坊间传闻越来越多了，且难辨真假。

1.2T万亿参数，5.2PB训练数据，高效利用华为芯片……只能说如果有一半是真的都很牛了。

HuggingFace创始人此时推荐“以不变应万变”，打开官方认证账号的更新提醒，就能第一时间获取通知。

抛开具体泄露数据是否准确，大家似乎有一个共识：如果真的有R2，它的基础模型会是新版DeepSeek V3-0324。

之所以有很多人相信R2会在4月底发布，有一部分原因也是出于R1与V3之间相隔了一个月左右。

现在，等不及DeepSeek官方，开源社区已经开始自己动手给V3-0324加入深度思考了。

新模型DeepSeek-R1T-Chimera，能力与原版R1相当，但速度更快，输出token减少40%，也是基于MIT协议开放权重。

相当于拥有接近R1的能力和接近V3-0324的速度，结合了两者的优点。

而且做到这一点，不是靠微调或蒸馏，而是DeepSeek V3-0324和R1两个模型融合而成。

R1+V3融合模型

新模型R1T-Chimera并非DeepSeek官方出品，而是来自德国团队TNG Technology Consulting。

该团队此前也探索过可调专家混合（MoTE）方法，让DeepSeek-R1在推理部署时可以改变行为。

新的R1T-Chimera模型权重可在HuggingFace下载，也可以在OpenRouter免费在线试玩。

目前已知是选用了V3-0324的共享专家+R1与V3-0324的路由专家的混合体融合而来。

TNG团队表示最终结果令人惊讶，不仅没有表现出融合模型的缺陷，相反，思考过程还比原版R1更紧凑有序。

暂没有技术报告或更详细的模型融合方法公布，要验证它是否符合描述，就只能拉出来试一试了。

我们选用最新折磨AI的难题“7米长的甘蔗如何通过2米高1米宽的门？”。

原版R1思考了13秒就下了结论；R1T Chimera在这里却足足思考了101秒，最终计算出可以通过。

虽然还是无法像人类一样直观的理解三维空间，让甘蔗与门的平面垂直就可通过，但依然通过计算夹角与投影得出了结论。

在这100秒时间里R1T-Chimera如何一步步思考出答案呢？

展开推理token可以发现，在简单计算二维方案不可行后，它就已经想到了三维方案。

后面依然陷入了各种误区，在旋转甘蔗、弯曲甘蔗、计算“门的厚度”上走了弯路。

最终通过“揣摩出题人心理”走进正确的路线。

最终给出的答案非常严谨了。

虽然人类直觉上就能想出把甘蔗垂直起来通过这个方法，但仔细一想，题目中确实没有给出“门后有多少空间这个条件”。

细还是AI细。

关于R1T-Chimera的更多细节，大家还在等TNG团队消息和更多第三方基准测试结果。

不过也有人注意到，KIMI K1.5技术报告中也探索了模型融合方法。

具体来说是把长思维链（long-cot）模型和短思维链（short-cot）模型融合，直接对两个模型的权重取平均值，获得一个新模型，无需重新训练。

不过在实验中，这种简单融合方法表现并不如这篇论文中提出的Long2short强化学习方法。

另一个在模型融合上有经验的团队是Transformer作者Llion Jones创办的Sakana AI。

早在24年初就结合进化算法提出以block为单位融合的方法。

随着更多团队跟进这一路线，模型融合会不会成为2025年大模型的一大技术趋势呢？欢迎在评论区留下你的看法。

HuggingFace：
https://huggingface.co/tngtech/DeepSeek-R1T-Chimera

在线试玩：
https://openrouter.ai/tngtech/deepseek-r1t-chimera:free

参考链接：
[1]https://x.com/tngtech/status/1916284566127444468

主题测试文章，只做测试使用。发布者：人脑网，转转请注明出处：https://www.rennao.com.cn/9568.html

赞 (0)

0 0

RAG性能暴增20%！清华等推出以笔记为中心的深度检索增强生成框架

上一篇 2025年4月29日下午3:28

美国T-Mobile宣布推出全国性5G SA网络

下一篇 2025年4月29日下午3:29

智能

LIama 4发布重夺开源第一！DeepSeek同等代码能力但参数减一半

AI不过周末，硅谷也是如此。大周日的，Llama家族上新，一群LIama 4就这么突然发布了。这是Meta首个基于MoE架构模型系列，目前共有三个款： Llama 4 Scout、Llama 4 Maverick、Llama 4 Behemoth。最后一个尚未推出，只是预告，但Meta已经毫不避讳地称前两者是“我们迄今为止最先进的型号，也是同类产品中最…

人脑网
2025年4月6日
16000
智能

腾势N9以180km/h鱼钩测试成绩刷新世界纪录！中国SUV安全性能登顶

4月16日，腾势N9通过权威机构中国汽研测试认证，以180km/h的速度再次刷新全球鱼钩测试纪录，实现高速下稳定操控。腾势N9也成为国内首款获得权威机构鱼钩测试认证的车型。真实的鱼钩测试，每天都在上演鱼钩测试，又被称为“死亡弯道”，是目前最大化模拟高速避障紧急转向工况的测试，也是最严苛的车辆操稳性能及防侧翻能力验证标准。简单来说，鱼钩测试就是车辆在高速行…

人脑网
2025年4月16日
19000
智能

医疗界迎来重磅大模型，还有10多个场景的智能体！

在人工智能技术重塑全球产业格局的浪潮中，医疗健康领域正迎来一场深刻的变革。4月9日，在2025中国国际医疗器械展览会(CMEF)同期，由联影举办的uAInnovation2025创新大会圆满落幕，来自产学研医各界嘉宾代表齐聚一堂，围绕数智涌现的未来医疗生态蓝图共话时代新篇。复旦大学附属中山医院副院长、党委书记顾建英，河南省人民医院副院长王梅云，中山大学肿瘤防…

人脑网
2025年4月11日
14000
智能

北京队再上大分：新AI一句话搞开发，代码实时可见 | 免费可用

什么？！现在随便一个完全不懂编程的人，都可以开发完整网站了？？？你没看错，现在搞开发啊，真的就是一句话的事儿例如你想做一个fashion一点的电商网站，那么你只需要来上一句：然后啊，这个AI就开始思考你需求的意图了。但毕竟咱们Prompt过于简单了，于是乎，这个AI还贴心地基于需求，给出了诸多细节选项，包括：响应式设计，适配不同设备商品分类和搜…

人脑网
2025年4月15日
20000
智能

o3/o4-mini幻觉暴增2-3倍！OpenAI官方承认暂无法解释原因

OpenAI新模型发布后，大家体感都幻觉更多了。甚至有人测试后发出预警：使用它辅助编程会很危险。具体来说，它经常捏造从未运行过的代码返回结果，在被质问时找理由狡辩，甚至还会说是用户的错。当大家带着疑问仔细阅读System Card，发现OpenAI官方也承认了这个问题，与o1相比o3幻觉率是两倍，o4-mini更是达到3倍。并且OpenAI只是说“需…

人脑网
2025年4月21日
9000

发表回复

联系我们

400-800-8888

在线咨询： QQ交谈

邮件：admin@example.com

工作时间：周一至周五，9:30-18:30，节假日休息

关注微信