Meta 开源 LlamaFirewall 防护工具,助力构建安全 AI 智能体

人脑网 5 月 9 日消息,Meta AI 公司最新推出 LlamaFirewall,应对 AI 智能体不断演变的威胁格局,为生产环境中的 AI 智能体提供系统级安全保护。

随着大型语言模型(LLMs)嵌入 AI 智能体并被广泛应用于高权限场景,安全隐患随之增加。这些智能体可以读取邮件、生成代码、调用 API,一旦被恶意利用,后果不堪设想。

传统的安全机制,如聊天机器人内容审核或硬编码模型限制,已无法满足具备广泛能力的 AI 智能体需求。Meta AI 针对提示注入攻击、智能体行为与用户目标不一致、以及不安全的代码生成三大核心挑战,开发了 LlamaFirewall。

人脑网援引博文介绍,LlamaFirewall 采用分层框架,包含三个专门的防护模块:

  • PromptGuard 2 是一个基于 BERT 架构的分类器,能实时检测越狱行为和提示注入,支持多语言输入,其 86M 参数模型性能强劲,22M 轻量版本则适合低延迟部署。
  • AlignmentCheck 是一种实验性审计工具,通过分析智能体内部推理轨迹,确保行为与用户目标一致,特别擅长检测间接提示注入。
  • CodeShield 则是一个静态分析引擎,检查 LLM 生成代码中的不安全模式,支持多种编程语言,能在代码提交或执行前捕获 SQL 注入等常见漏洞。

Meta 在 AgentDojo 基准测试中评估了 LlamaFirewall,模拟了 97 个任务领域的提示注入攻击。

结果显示,PromptGuard 2(86M)将攻击成功率(ASR)从 17.6% 降至 7.5%,任务实用性损失极小;AlignmentCheck 进一步将 ASR 降至 2.9%;整体系统将 ASR 降低 90% 至 1.75%,实用性略降至 42.7%。CodeShield 在不安全代码数据集上也表现出色,精准度达 96%,召回率(recall) 79%,响应时间适合生产环境实时使用。

Meta 开源 LlamaFirewall 防护工具,助力构建安全 AI 智能体

主题测试文章,只做测试使用。发布者:人脑网,转转请注明出处:https://www.rennao.com.cn/12305.html

(0)
人脑网的头像人脑网
上一篇 2025年5月10日 下午3:08
下一篇 2025年5月10日 下午3:10

相关推荐

  • AI时代应用开发革命将至?鲲鹏昇腾开发者大会2025看点揭秘!

    【ZOL人脑网原创新闻】在当今快速发展的科技浪潮中,人工智能(AI)技术正以前所未有的速度重塑各个行业的格局。尤其是像DeepSeek等大型模型的开源特性,显著降低了企业和开发者的技术门槛,推动了智能化转型的进程。 然而,AI在赋能开发者提效降本同时,也为开发者带来新的挑战:头部企业持续追求极致性能。开发者需要深度开放的平台和生态,通过底层创新释放极致算力;…

    2025年5月19日
    800
  • 专利暗示《GTA 6》游戏突破,角色动画技术大革新

    人脑网 4 月 16 日消息,YouTube 频道 CYBER BOI 昨日(4 月 15 日)发布视频,报道称基于最新获批的 88 页专利文档,《侠盗猎车手 6》(Grand Theft Auto 6,简称 GTA 6)游戏在角色动画上,会有突破性创新。 人脑网附上视频如下: 该专利由 Take-Two Interactive(Rockstar Games…

    2025年4月16日
    2500
  • 广联达G+平台使用指南

    以前广联达切换有些复杂,但现在发展得越来越好。最近体验了其整合平台G+,感觉不错。接下来,就为大家介绍如何通过G+安装广联达软件。 1、 在搜索引擎中输入广联达关键词,就会显示出许多关于广联达的相关内容。 2、 此时,若仅如此搜索,首个出现的是广联达官网。虽可在其中查找G+,但稍显繁琐,建议直接搜索广联达G+更便捷。 3、 打开搜索结果首个网站,进入后可见广…

    2025年4月30日
    1300
  • 英特尔首席商务官 Christoph Schell 将于 6 月末离任,转投 Kuka

    人脑网 5 月 3 日消息,英特尔在当地时间 4 月 28 日向美国证券交易委员会 SEC 提交的 Form 8-K 文件中确认,该企业执行副总裁、首席商务官、SMG(销售、营销和传播集团)经理 Christoph Schell 将于今年 6 月 30 日离任。 另据 Christoph Schell 的个人领英动态,这位高级管理人才将从今年 7 月 1 日…

    2025年5月3日
    1200
  • 5月19日正式发布!首款鸿蒙电脑抢先上手

    华为在今天举办的鸿蒙电脑技术与生态沟通会上正式发布了首款鸿蒙电脑,详细介绍了HarmonyOS 5鸿蒙电脑操作系统的设计,并官宣将于5月19日14点半举办发布会,届时将正式发布鸿蒙电脑硬件产品。 现在我们带来了首款鸿蒙电脑抢先上手体验,大家可以和我们一同感受鸿蒙电脑的无限魅力。

    2025年5月8日
    900

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信