数月 → 几天:OpenAI 被曝缩水模型安全测试,AI 竞赛埋下隐患

人脑网 4 月 12 日消息,金融时报(FT)昨日(4 月 11 日)发布博文,报道称 OpenAI 大幅压缩最新大型语言模型(LLM)安全测试时间,此前需要数月时间,而最新 o3 模型仅有几天时间。

竞争驱动,安全让步

据八位知情人士透露,OpenAI 大幅压缩模型的安全测试时间,留给员工和第三方测试团队“评估”(evaluations,即测试模型风险和性能)时间仅有数天时间,而此前通常会耗时数月时间。

人脑网援引博文介绍,OpenAI 面临来自 Meta、Google 及 xAI 等对手的激烈竞争,需快速推出新模型以维持市场优势。o3 模型计划最早下周发布,留给测试者安全检查时间不到一周,而此前 GPT-4 的测试期长达六个月。

一位测试过 GPT-4 的人士透露,过去安全测试更彻底,某些危险能力在测试两个月后才被发现,而如今竞争压力迫使公司追求速度,忽视潜在风险。

测试不足,监管缺位

全球目前尚未统一 AI 安全测试标准,但欧盟《AI 法案》将于今年晚些时候上线,要求企业对其最强大的模型进行安全测试。

AI Futures Project 负责人 Daniel Kokotajlo 表示,由于缺乏强制监管,企业不会主动披露模型的危险能力,竞争压力进一步加剧了风险。

OpenAI 曾承诺构建定制模型版本,测试其潜在滥用风险,例如是否能协助制造更具传染性的生物病毒。

这种测试需投入大量资源,包括聘请外部专家、创建特定数据集并进行“微调”(fine-tuning)。但 OpenAI 仅对较老旧的模型进行有限微调,最新模型如 o1 和 o3-mini 未全面测试。前 OpenAI 安全研究员 Steven Adler 批评,若不兑现测试承诺,公众有权知情。

数月 → 几天:OpenAI 被曝缩水模型安全测试,AI 竞赛埋下隐患

安全测试未覆盖最终模型

另一问题在于,安全测试通常基于早期“检查点”(checkpoints),而非最终发布模型。一位前 OpenAI 技术人员表示,发布未经测试的更新模型是“不良做法”,而 OpenAI 辩称,其检查点与最终模型“基本一致”,并通过自动化测试提高效率,确保安全。

主题测试文章,只做测试使用。发布者:人脑网,转转请注明出处:https://www.rennao.com.cn/4742.html

(0)
人脑网的头像人脑网
上一篇 2025年4月12日 下午3:13
下一篇 2025年4月12日 下午3:15

相关推荐

  • 粤港澳车展仰望全车系齐亮相 仰望U8L全新车色首发

    2025年5月31日,以“面向科技·面向未来·面向市场”为主题的2025(第二十九届)粤港澳大湾区车展在深圳国际会展中心(宝安)拉开帷幕。作为比亚迪旗下的百万级高端新能源汽车品牌,仰望汽车携仰望U7、仰望U8、仰望U8L、仰望U9全产品矩阵亮相,仰望U8L曜石黑配日珥金全新车色首发。此外,车展期间观众可在馆区外场体验仰望U8应急浮水、仰望U7云辇-Z等仰望独…

    2025年6月2日
    1100
  • 国科微推出 AI ISP 品牌“圆鸮”,首颗芯片已在安防行业得到应用

    人脑网 4 月 23 日消息,国科微今日宣布推出新一代自研 AI ISP(图像处理引擎 / 图像信号处理器)品牌“圆鸮”。鸮即指猫头鹰及其近亲鸟类,具有一双夜视和洞察能力出色的大眼睛,这一命名体现了国科微 AI ISP 在暗光增强、细节捕捉等方面的优势。 国科微宣称其圆鸮AI ISP 具备六大特性:超感光降噪、多光谱融合、超级广角、超级稳像、快速对焦和 RG…

    2025年4月23日
    1500
  • DIY从入门到放弃:监控盘和企业盘你选谁?

    对于需要大容量存储的用户来说,机械硬盘可以说是首选,我们会看到价格更低的监控盘,还有定位更高的企业盘,那么监控盘能当作普通硬盘使用吗?企业盘是否值得额外投资?我们需要了解这两种硬盘的“内在美”。 监控盘:为视频监控优化的特殊设计 监控硬盘,顾名思义,是专门为视频监控系统设计的存储设备,这类硬盘最大的特点是针对视频监控场景进行了特殊优化,能够满足7×24小时不…

    2025年5月30日
    900
  • 追求没那么极致,为什么选上代旗舰更超值?

    【ZOL人脑网原创技术】在如今的手机市场,新款旗舰机层出不穷,但消费者却越来越理性。许多人发现,追求“最新”并不总是最优解,反而上一代旗舰机在性价比上更具吸引力。尤其是对于那些不追求极致参数、更看重实用体验的用户来说,上一代旗舰机往往能在提供均衡体验的同时拥有更高的性价比。OPPO Find X8就是这样一款“没那么极致”,却依然值得入手的手机。 1 拍照能…

    2025年6月15日
    600
  • 阿斯麦:预计今年中国市场表现强于预期,没有在美设厂计划

    人脑网 4 月 18 日消息,据路透社报道,当地时间周三,ASML 首席财务官戴厚杰(Roger Dassen)表示,2025 年以来,中国市场对 ASML 芯片制造设备的需求远超预期。 作为全球最大的芯片制造设备供应商,ASML 早在去年 10 月曾预测,中国市场的销售占比将下滑至净系统销售额的 20%。不过,Dassen 在媒体电话会议上表示,实际情况比…

    2025年4月18日
    3300

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信