瘦身不降智!大模型训推效率提升30%,京东大模型开发计算新研究

京东探索研究院关于大模型的最新研究,登上了Nature旗下期刊!

该项研究提出了一种在开放环境场景中训练、更新大模型,并与小模型协同部署的系统与方法

它通过模型蒸馏、数据治理、训练优化与云边协同四大创新,这个项目将大模型推理效率平均提升30%,训练成本降低70%

这个名为《Omniforce:以人为中心的、赋能大模型的、云边协同的自动机器学习系统》的项目,发表在Nature旗下期刊npj Artificial Intelligence上。

瘦身不降智!大模型训推效率提升30%,京东大模型开发计算新研究

据介绍,这是国内首个系统性解决开放环境下大模型开发效率难题并获国际顶刊认证的研究成果。

提出四个创新方法,推理平均提效30%

企业将大模型应用付诸实践,面临着诸多卡点:

一方面进入大模型应用门槛高,另一方面模型训练与推理效率低。

京东大模型开发计算技术,能支持企业的模型开发训练及生产,让庞大、重型的AI模型“瘦身”成精悍的小模型,精华依旧,效率大增,瘦身不降智。

既能节省算力资源,加速推理,还能适应多平台,广泛部署到更多平台上。

论文中提出了四个创新方法:

  • 模型蒸馏:采用动态分层蒸馏技术,特别是在预训练阶段进行蒸馏,调整仅0.5%的参数实现低资源场景下的高效训练,减少大型模型的部署成本。
  • 数据治理:提出跨领域数据动态采样算法,自动混合不同领域数据,并引入隐私保护和主动学习技术,提升大模型泛化能力。
  • 训练优化:使用贝叶斯优化(BO)框架进行超参数优化和架构搜索,尤其是擅长处理离散空间,MPMD场景下资源利用率提升40%。
  • 云边协同:支持在云端进行模型搜索和训练,边缘设备负责部署和推理,并利用两阶段压缩策略以适应资源限制,提升云边协作的高效性。

瘦身不降智!大模型训推效率提升30%,京东大模型开发计算新研究

值得一提的是,该平台还可支持京东大模型、Llama、DeepSeek等多个模型的蒸馏、推理。

在模型蒸馏层面,效果较同量级模型有明显提升。

以京东大模型为例,蒸馏后的大模型Livebench提升14分。

大量的实验结果也证明有效性和效率,推理平均提效30%,训练成本平均降低70%

根据企业自身业务,将通用模型转化为专业模型

这套京东沉淀下来的大模型开发计算的技术,支撑了JoyBuild大模型开发计算平台,广泛服务行业用户。

JoyBuild能够为客户的大模型开发和行业应用开发,提供定制化解决方案。

它支持各类模型的调优开发,内置20余种开源模型和丰富的数据集,并提供100余种算法和工具链,帮助企业根据自身业务特征,将通用模型迅速转化为专业模型,一站式应用大模型

现在,不到一周时间,企业即可完成从数据准备、模型训练到模型部署的全流程;之前需要10余人的科学家团队工作,现在只需要1-2个算法人员;通过平台模型加速工具优化,节约90%的推理成本。

京东丰富的业务场景,还为平台上的基础大模型提供具体的行业应用场景,加速基于大模型的商业化落地。

在行业知识库之外,JoyBuild沉淀了京东自己的零售、物流、健康、金融等行业Know-How,可应用于供应链优化、智能客服、营销内容生成等各类场景,加速模型普惠。

京东给出的大模型解法并不是“黑箱”,而是一条解决大模型训练效率及应用问题的通用路径,是真正的“授之以渔”。

未来,京东将进一步提升大模型开发与计算效率,让中小型和大型企业都能低成本、高效构建专属AI应用,助推AI规模化应用落地。

主题测试文章,只做测试使用。发布者:人脑网,转转请注明出处:https://www.rennao.com.cn/15339.html

(0)
人脑网的头像人脑网
上一篇 2025年5月21日 下午3:22
下一篇 2025年5月21日 下午3:23

相关推荐

  • 智能车速度刷新:仅10个月,首个纯端侧大模型上车量产!

    端侧大模型圈子的《速度与激情》,就这么水灵灵地上演了。 坐标上海车展,在长安马自达新车发布之际,车上的智能座舱竟然成了大亮点之一。 因为速度着实有点太快——从零到量产,只花了10个月的时间! 要知道,这件事儿在汽车领域里面,一般都是要按“年”这个单位来计算。 此举可谓是一鸣惊人,一举刷新行业纪录,一步迈进了“月”的计量单位。 而且啊,搞出这件事的,还是车圈的…

    2025年4月25日
    1800
  • 不懂建模也能做角色!VAST升级AI神器,一手实测来了

    AI建模界的“作弊神器”真的来了! 3D大模型明星初创VAST推出的Tripo Studio此次大升级—— 四大核心功能:智能部件分割、贴图魔法笔刷、智能低模生成、万物自动绑骨等。给人一种感受是,AI终于懂得建模了。不是那种只会给你乱糊一个模型出来的AI,而是每个功能都直击过去建模流程里的痛点。 过去想做个角色模型只能外包,报价单上四位数的数字和“改到满意”…

    2025年5月30日
    500
  • 23999元起,鸿蒙「折叠屏」电脑来了!展开比手机还薄

    华为鸿蒙电脑,正式发布! 并且,还有折叠屏新惊喜来袭: 展开18英寸,折叠13英寸,重量1.16kg,甚至比一些手机还薄。 余承东刚一官宣,现场立即爆发“遥遥领先”的欢呼声。 热搜也是火速跟上: 线上网友们纷纷表示: 关键是定价,也给了大家伙一点小小的震撼: 32GB + 1TB,售价元; 32GB + 2TB,售价元。 这个价格,你觉得香不香? 另外,此前…

    2025年5月20日
    700
  • 重构训练框架,开源新方法:抛弃替代损失函数,仅需优化原始目标

    抛弃替代损失函数,仅需优化原始目标, 强化学习新范式来了: 消除critic和reference模型,避免KL散度约束;解决优势函数和梯度估计两个偏差。 来自阿里-高德地图的团队提出了一种相当简单的强化学习训练新方法:组策略梯度优化GPG(Group Policy Gradient)。 GPG开创性地从底层重构强化学习训练框架,仅需优化原始目标,解决已有方法…

    2025年4月27日
    1900
  • 微软CEO和奥特曼失了和,OpenAI被“断粮”

    就很突然。 许久没有同框的奥特曼和微软CEO纳德拉,刚刚在推特上“大秀恩爱”,还透露正在讨论合作新进展。 这没由来的操作,难道是有新发布? 但仔细一扒,或许更可能是回应新八卦。 就在这两天,《华尔街日报》放出猛料: 奥特曼和纳德拉,这对昔日让两家公司合作共赢的big name,在诸多事情上分歧日渐加大,渐行渐远 奥特曼是谁?OpenAI的掌舵者;纳德拉是谁?…

    2025年5月2日
    1100

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信