发布豆包深度思考模型,火山引擎要争夺Agent市场

界面新闻记者 | 肖芳
界面新闻编辑 | 文姝琪

DeepSeek走红数月之后,字节跳动终于对外发布自研的深度思考模型。

4月17日,豆包1.5・深度思考模型由火山引擎对外发布,面向企业市场提供服务。技术报告显示,豆包深度思考模型采用MoE架构,总参数为200B,激活参数为20B。相比之下,同样采用MoE架构的DeepSeek-V3模型总参数为671B,激活参数为37B。

豆包1.5・深度思考模型的参数实现更小,但从评测结果来看,其能力不逊于顶尖模型的效果。其中,豆包1.5・深度思考模型在专业领域的推理任务中表现出色,数学推理AIME 2024测试得分追平OpenAI o3-mini-high,编程竞赛和科学推理测试成绩也接近o1,在编程竞赛Codeforces pass@8得分接近 OpenAI o1,在科学推理GPQA 得分接近o3-mini。

同时,基于高效算法和高性能推理系统,豆包模型API服务在保障高并发的同时,延迟低至20毫秒。

豆包深度思考模型还上线了多模态版,具备视觉推理能力,能像人类一样对看到的事物进行联想和思考,拓展了智能推理的应用边界。比如,这款模型可以看懂复杂的企业项目管理流程图表,快速定位到关键信息,并能够严格按照流程图,回答客户的问题。在分析航拍图时,能结合地貌特征判断区域开发可行性。

从现场演示来看,上传一份可口可乐财报,豆包深度思考模型能够提取财报中不同区域的营收、增长等关键数据指标,并能够结合这些数据分析不同区域数据表现差异的原因;上传一份西餐厅菜单图片,并给出点餐需求和预算指令,豆包深度思考模型能够推理不同菜品是否符合需求,从而按照开胃菜、主菜、配菜、甜点搭配推荐菜品。

去年5月,字节跳动首次对外发布豆包系列模型。一年以来,豆包系列模型的数量在不断增加,模型的能力也在持续提升。豆包多款主力模型的发布都晚于同行,但还是有其市场认可度。

据火山引擎披露,截至2025年3月底,豆包大模型日均tokens调用量已达到12.7万亿,较去年5月发布时增长上百倍。火山引擎总裁谭待在接受界面新闻等媒体采访时透露,从长期来看,豆包大模型日均tokens调用量百倍甚至更高的增长是有可能的。但未来两三年内,最关键的取决于模型是否有重大突破。

去年,豆包大模型首次对外发布,火山引擎把豆包大模型的定价降低了一个数量级。其中,豆包通用模型pro-32k版,模型推理输入价格不足市面上同规格模型的定价的1%;豆包通用模型pro-128k版,模型推理输入价格比行业价格低95.8%。在谭待看来,基础信息处理能力的提升以及成本的下降让豆包大模型从去年到今年获得了快速增长,今年模型在深度思考能力上的突破又带来新的增长。

火山引擎也在遵循相同的逻辑思考大模型未来的增长点。谭待认为,视觉推理能力以及Agent相关技术能否获得重大突破,是未来几年大模型增长的关键节点。

此次发布豆包深度思考模型,火山引擎正是在押宝这两个新的机会。因为现实世界中的很多应用场景是靠视觉驱动的,豆包深度思考模型具备了视觉推理能力,便可以在更多场景助力企业进行落地应用。

火山引擎更大的野心在于争夺Agent市场的机会。2025年被业界视为“Agent智能体元年”。谭待认为,在多模态深度思考模型的基础上,Agent需要良好的架构和工具,去操作数字世界和物理世界。同时,模型的推理成本和延迟要持续降低,才能推动应用普惠。

为此,火山引擎宣布推出OS Agent解决方案,并演示了由Agent操作浏览器,搜索商品页,实现iPhone比价的任务,甚至由Agent在远程计算机上用剪映进行视频编辑、配乐。

据发布会现场的介绍,OS Agent解决方案包含豆包UI-TARS模型,以及veFaaS函数服务、云服务器、云手机等产品,实现对代码、浏览器、电脑、手机以及其他Agent的操作。其中,豆包UI-TARS模型将屏幕视觉理解、逻辑推理、界面元素定位和操作整合在一起,突破传统自动化工具依赖预设规则的局限性,为Agent的智能交互提供了更接近人类操作的模型基础。

好的模型和工具能够加速Agent的落地,但Agent也会带来更大量的模型推理消耗。面对大规模推理需求,火山引擎还有AI云原生ServingKit推理套件,让模型部署更快、推理成本更低,GPU消耗相比传统方案降低80%。

谭待在接受媒体采访时表示,聊天和信息处理只是AI应用的一小部分,AI要真正为各行各业带来变革,Agent是必经之路。对于垂直类Agent,火山引擎会基于自身优势领域进行探索;对于通用型Agent,火山引擎更重要的是搭建好基础框架、提供好用的工具。

IDC发布的《中国公有云大模型服务市场格局分析,1Q25》显示,火山引擎以46.4%的市场份额位居第一。

豆包大模型去年率先降价对火山引擎的增长提供了积极助力,火山引擎也希望通过Agent应用增长的机会获得更大的市场份额。谭待表示,每一次大的模型突破都肯定能激发一次大的变化,他对未来2年内豆包大模型的调用量能否再翻100倍保持谨慎乐观。

主题测试文章,只做测试使用。发布者:人脑网,转转请注明出处:https://www.rennao.com.cn/6866.html

(0)
人脑网的头像人脑网
上一篇 2025年4月18日 下午3:11
下一篇 2025年4月18日 下午3:13

相关推荐

  • 谷歌又遭美国反垄断大锤 业务拆分压力与日俱增

    财联社4月18日讯(编辑 刘蕊)美东时间周四,一名美国地方法官裁定,Alphabet旗下谷歌非法主导了两个在线广告技术市场。这对这家科技巨头来说是又一次打击,并为美国反垄断检察官寻求分拆Alphabet的广告业务铺平了道路。 谷歌又遭反垄断大锤 美国弗吉尼亚州亚历山大市的地区法官布林克玛(Leonie Brinkema)裁定,谷歌在出版商广告服务器市场和介于…

    2025年4月18日
    2800
  • 5G发牌六周年:5G-A从启航到跃升,谱写科技改变社会新篇

    人脑网讯 6月10日专稿(蒋均牧)2019年6月6日,工信部向四家运营商颁发5G商用牌照,在神州大地上投下一粒火种。六年后的今天,这粒火种已然形成燎原之势,演变为经济社会高质量发展的“助推器”、“强引擎”。 从珠峰之巅到南海岛礁、从使能美好生活到促进新质生产力,我国织就了全球最大的5G精品网,支撑起繁荣多样的“5G+”应用生态——无论网络覆盖之广、用户规模之…

    2025年6月11日
    900
  • VRETF(159786)强势上涨2.18%!全球AI眼镜出货量有望增长至8000万副

    4月30日,中证虚拟现实主题指数(csi930821)盘中表现活跃,涨幅一度达到2.08%。相关ETF方面,VRETF(159786)同样表现强劲,其盘中涨幅一度达到了2.18%,反映出市场对虚拟现实板块的乐观预期。 今年以来,人工智能(AI)眼镜迅速从概念走向现实,成为消费市场的新宠。面对这一高景气赛道,不少品牌纷纷发力,密集发布智能眼镜相关产品。Roki…

    2025年4月30日
    1700
  • 2025公认「最强」长续航手机

    很多朋友在选手机时,并不一味追求极致性能,但续航能力一定是刚需。 过去我们多参考重度场景的续航成绩来做盘点,但不少用户反馈称:这类测试和他们日常使用差距太大。 所以本期,我们根据新评科技最新发布的综合场景续航榜,来聊聊那些在日常使用中也能扛得住的“续航狠角色”。 一、荣耀Power 参考价格:1856元(12+256GB) 荣耀Power搭载了骁龙7 Gen…

    2025年6月6日
    600

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信