陶哲轩DeepMind梦幻联动,最强通用科学Agent来了!

Nature:「令人惊叹」的通用科学人工智能来了!

谷歌DeepMind再次甩出一颗重磅炸弹:与陶哲轩等一众顶尖科学家一起共同打造AlphaEvolve

陶哲轩DeepMind梦幻联动,最强通用科学Agent来了!

它可以设计出更快的矩阵乘法算法,可以改进芯片设计、提高数据中心、AI训练的效率,已经在谷歌内部用上了。

它将Gemini架构中大型矩阵乘法运算加速了23%,从而将Gemini的训练时间缩短了1%,谷歌程序员狂喜(bushi)。此外还将FlashAttention提速了32.5%。

几百年前未曾解决过的数学问题,也都能因为它前进一大步。

比如一个经典的300年前的几何挑战接吻数(Kissing Number)问题。它关注的是,给定空间内球面相切的不重叠球体的最大数量。

一维空间和二维空间是这样的。

陶哲轩DeepMind梦幻联动,最强通用科学Agent来了!

AlphaEvolve发现了一个由593个外球体组成的结构,直接刷新了11维空间中的下限。

wiki百科上已经更新了记录。

陶哲轩DeepMind梦幻联动,最强通用科学Agent来了!

而它的潜力还在释放当中,陶哲轩表示这个工作还在进行,接下来希望会汇报更多进展。搓搓手期待了~

陶哲轩DeepMind梦幻联动,最强通用科学Agent来了!

目前它推出了早期邀测试用,在官网填写表格,就有机会使用哦~不仅限学术圈的朋友。

AlphaEvolve:谷歌数据中心/芯片设计已经用上

AlphaEvolve是啥?按照官方介绍,这是个LLM驱动的进化编码Agent,用于通用算法的发现与优化。

它包括三个部分:

  • 大模型:综合有关问题的信息以及以前解决问题的尝试,并提出新版本的算法;
  • 自动评估器:验证、运行和评分所提出的算法。
  • 进化框架:迭代改进所发现的最佳算法,并重新组合不同解决方案的想法,以找到更好的算法。

陶哲轩DeepMind梦幻联动,最强通用科学Agent来了!

值得一提的是,这里的大模型是一系列大模型。

比如主打速度和效率Gemini Flash能够最大限度地拓展探索的思路广度;而性能更强的Gemini Pro则能够提供深刻的深度和富有洞察力的建议。这些模型共同构建了以代码形式实现算法解决方案的算法。

过去一段时间,AlphaEvolve提升了谷歌数据中心、芯片设计和AI训练流程的效率,包括训练AlphaEvolve本身所依赖的大模型本身。它还帮助设计了更快的矩阵乘法算法,并找到了解决开放性数学问题的新方法,展现出在众多领域应用的巨大潜力。

具体来看。

优化计算生态系统

过去一年,他们将AlphaEvolve发现的算法部署到了谷歌整个计算生态系统中,包括数据中心、硬件和软件。

陶哲轩DeepMind梦幻联动,最强通用科学Agent来了!

改善数据中心调度

AlphaEvolve发现了一种简单且有效方法,可以帮助Borg更高效地协调谷歌庞大的数据中心。

(Borg是一种集群管理器,它运行着来自数千个不同应用程序的数十万个作业,这些作业分布在多个集群中,每个集群最多包含数万台机器。)

该解决方案已投入生产超过一年,平均持续恢复谷歌全球0.7%的计算资源。这种持续的效率提升意味着,在任何特定时刻,相同的计算资源占用空间可以完成更多任务。

除此之外,它还带来了一些操作上面的优化:可解释性、可调试性、可预测性和易于部署性。

协调硬件设计

AlphaEvolve提出了一个Verilog重写方案,删除了矩阵乘法关键算术电路中高度优化的、不必要的位。

至关重要的是,该方案必须通过稳健的验证方法,以确认修改后的电路保持功能正确性。该方案已被集成到即将推出的TPU中。

增强AI训练和推理

除此之外,AlphaEvolve还加速了Gemini的性能和速度。

通过找到将大型矩阵乘法运算划分为更易于管理的子问题的更智能方法,AlphaEvolve将Gemini架构中的这一重要内核加速了23%,从而将Gemini的训练时间缩短了1%。

除了性能提升,AlphaEvolve还大大减少了内核优化所需的工程时间,从专家数周的努力缩短到自动实验的数天,使研究人员能够更快地进行创新。

AlphaEvolve还能优化低级GPU指令。AlphaEvolve对基于Transformer的FlashAttention内核实现了高达32.5%的提速。这种优化可以帮助专家找出性能瓶颈,并轻松地将改进措施纳入代码库,从而提高他们的工作效率,并在未来节省计算和能源。

推进数学和算法发的前沿

基于计算机程序的极简代码框架,它设计了一种基于梯度的新型优化程序的诸多组件,发现了矩阵乘法的多种新算法。

陶哲轩DeepMind梦幻联动,最强通用科学Agent来了!

比如,它发现了一种使用48次标量乘法来对4×4复值矩阵进行乘法运算的算法,改进了Strassen于1969年提出的算法,该算法此前被认为是此类算法中的最佳算法。

与之前的AlphaTensor相比,后者专注于矩阵乘法算法,对于4×4矩阵,仅发现了二进制运算的改进。

他们还将该系统应用于数学分析、几何学、组合学和数论领域的50多个未解决的问题。

在大约75%的案例中,它能够重新发现最先进的解决方案。在20%的案例中,它改进了之前已知的最佳解决方案。

陶哲轩DeepMind梦幻联动,最强通用科学Agent来了!

陶哲轩与DeepMind合作

2023年,他们的FunSearch首次证明大型语言模型可以生成用计算机代码编写的函数,如今在这基础之上,已经展现出解决通用算法/数学问题的潜力。

从团队上看也新增了不少合作者,谷歌之前的顶尖科学家,比如就有陶哲轩。

陶哲轩DeepMind梦幻联动,最强通用科学Agent来了!

他们还与People+AI团队一起建立了个用户友好的交互界面。

虽然AlphaEvolve目前正被应用于数学和计算机领域,但其通用性意味着它可以应用于任何问题,其解决方案可以被描述为算法并自动验证。

但他们相信,AlphaEvolve可以在材料科学、药物发现、可持续发展以及更广泛的技术和商业应用等更多领域带来变革。

白皮书:
https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/AlphaEvolve.pdf
参考链接:
[1]https://mathstodon.xyz/@tao/114508029896631083
[2]https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/
[3]https://x.com/GoogleDeepMind/status/1922669325283942539

主题测试文章,只做测试使用。发布者:人脑网,转转请注明出处:https://www.rennao.com.cn/14025.html

(0)
人脑网的头像人脑网
上一篇 2025年5月15日 下午4:37
下一篇 2025年5月15日 下午4:38

相关推荐

  • UniToken:多模态“全能选手”,一次编码搞定图文理解与图像生成

    首次在统一框架内实现理解与生成的“双优表现”,打破了多模态统一建模的僵局! 复旦大学和美团的研究者们提出了UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾了图文理解与图像生成任务,并在多个权威评测中取得了领先的性能表现。 UniToken通过融合连续和离散视觉表征,有效缓解了以往方法中“任务干扰”和“表示割裂”的问题,为多模态统一建模提供了新…

    2025年4月25日
    1900
  • 8秒极速生成!复杂场景图像定制低成本轻松驾驭,已开源

    可控图片生成,如今已经不是什么新鲜事。甚至也不需要复杂的提示词,用户通过简单的文本描述,就能快速生成符合个人需求的创意图像。 不过仍然有一些局限: 比如说,虽然可以实现单一任务(如身份、主体、风格、背景等)的定制化设计,可是一旦条件增多,就会出现“鱼和熊掌不可兼得”的问题。 只有小孩子才做选择题,成年人当然是全都要! 字节跳动与北京大学联合起来,证明了“全都…

    2025年5月15日
    800
  • 10秒生成官网,WeaveFox重塑前端研发生产力 | 蚂蚁徐达峰

    AI入职大厂担当程序员编程助手,如今已非新鲜事。 不过,随着实践的深入,新的问题正在出现:AI生成代码需要大量翻修、安全生产难以保障…… “如果不能找到一个合适的切入点,可能会适得其反——用AI不如不用AI。” 作为技术变革的一线亲历者,蚂蚁集团平台智能体验技术负责人徐达峰如是坦言。 聚焦前端开发场景,徐达峰和他的团队打造了WeaveFox智能研发体系进行A…

    2025年4月30日
    1500
  • 机器人杭州上演格斗赛!宇树CEO王兴兴:创造了人类历史新时刻

    激烈,着实激烈! 全球首个人形机器人格斗赛刚刚在杭州落下帷幕,战况那叫一个精彩纷呈。 贴身肉搏、侧身闪避、倒地后快速爬起…格斗技巧的十八般武艺通通拿出来了: 当然也不乏搞笑画风,有选手直接对着空气一通乱挥: 本次公开表演赛一共有四支参赛队伍,均使用了宇树科技G1人形机器人 在经过两两PK后,最终由名为“AI测算师”的机器人夺冠: 对于整场比赛,有现场解说员激…

    2025年5月26日
    700
  • 打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力

    不再像CoT(“思维链”)一样“一个字一个字往外蹦”,加上“软思维”就能让大模型像人类一样进行抽象思考。 来自SimularAI和微软DeepSpeed的研究员联合提出了Soft Thinking,让模型在连续的概念空间中进行 “软推理”,而非局限于离散的语言符号,打破了基于离散token的推理瓶颈。 相比标准CoT,Soft Thinking最高提升Pas…

    2025年5月24日
    700

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信