AIGC宇宙 AIGC宇宙

OpenAI 的 GPT - 4.1 无安全报告,AI 安全透明度再遭质疑

作者:远洋
2025-04-16 07:42
OpenAI推出新AI模型GPT-4.1,但未按惯例发布安全报告,引发行业对AI透明度和安全性的担忧。前员工指出公司可能因竞争压力削减安全投入。#AI安全# #OpenAI#

本周一,OpenAI 推出了新的 AI 模型 GPT-4.1 系列。该公司表示,该模型在某些测试中,尤其是编程基准测试方面,表现优于其现有的一些模型。然而,与 OpenAI 以往的模型发布不同,GPT-4.1 并未附带通常伴随模型发布而公布的安全报告(即系统卡)。

OpenAI 的 GPT - 4.1 无安全报告,AI 安全透明度再遭质疑

截至周二上午,OpenAI 仍未发布 GPT-4.1 的安全报告,且似乎并无此计划。OpenAI 发言人 Shaokyi Amdo 在向 TechCrunch 发表的声明中表示:“GPT-4.1 并非前沿模型,因此不会为其发布单独的系统卡。”

通常情况下,人工智能实验室会发布安全报告,展示其内部以及与第三方合作伙伴开展的测试类型,以评估特定模型的安全性。这些报告有时会揭示一些不那么令人满意的信息,例如某个模型可能会欺骗人类或具有危险的说服力。总体而言,人工智能界普遍认为这些报告是人工智能实验室支持独立研究和红队测试的诚意之举。

然而,在过去的几个月里,一些领先的人工智能实验室似乎降低了其报告标准,引发了安全研究人员的强烈反对。例如,谷歌在发布安全报告方面行动迟缓,而其他一些实验室则发布了缺乏以往细节的报告。

OpenAI 近期的表现也并不出色。去年 12 月,该公司因发布了一份包含与实际部署生产版本不同的模型基准结果的安全报告而受到批评。上个月,OpenAI 在发布一款名为“深度研究”的模型后数周,才发布该模型的系统卡。

前 OpenAI 安全研究员 Steven Adler 指出,安全报告并非由任何法律或法规强制要求,而是自愿发布的。然而,OpenAI 曾多次向各国政府承诺,会增加其模型的透明度。2023 年,在英国人工智能安全峰会前夕,OpenAI 在一篇博客文章中称系统卡是其问责制方法的“关键部分”。而在 2025 年巴黎人工智能行动峰会之前,OpenAI 表示系统卡可以为模型的风险提供有价值的见解。

Adler 表示:“系统卡是人工智能行业用于透明度和描述安全测试内容的主要工具。如今的透明度规范和承诺最终是自愿的,因此是否以及何时为某个模型发布系统卡,取决于每家人工智能公司自己的决定。”

AI在线注意到,此次 GPT-4.1 未发布系统卡的背景是,OpenAI 的现员工和前员工对其安全实践提出了担忧。上周,Adler 与其他 11 名前 OpenAI 员工在埃隆・马斯克起诉 OpenAI 的案件中提交了一份拟议的法庭之友简报,认为营利性质的 OpenAI 可能会削减安全工作的投入。《金融时报》最近报道称,由于竞争压力,OpenAI 已经减少了分配给安全测试人员的时间和资源。

尽管 GPT-4.1 并非 OpenAI 旗下性能最高的 AI 模型,但在效率和延迟方面取得了显著进步。Secure AI Project 的联合创始人兼政策分析师 Thomas Woodside 称,性能的提升使得安全报告变得更加重要。他认为,模型越复杂,其可能带来的风险就越高。

目前,许多人工智能实验室一直在抵制将安全报告要求纳入法律的努力。例如,OpenAI 曾反对加州的 SB 1047 法案,该法案要求许多人工智能开发商对其公开发布的模型进行审计并发布安全评估。

相关标签:

相关资讯

全球化钓鱼攻击:DeepSeek仿冒网站遍布六国,用户需警惕

奇安信XLab实验室2月6日发布最新安全报告,揭示了一波针对DeepSeek用户的大规模网络钓鱼活动。 数据显示,仿冒DeepSeek的钓鱼网站数量已超过2000个,且仍在持续增长。 根据报告,在2024年12月1日至2025年2月3日期间,共发现2650个仿冒DeepSeek的域名。
2/7/2025 2:07:00 PM
AI在线

OpenAI推全新语音转录模型gpt-4o-transcribe,语音转文字准确率飙升

继此前在语音 AI 领域引发一些关注后,OpenAI并未停下在该领域探索的脚步,现在这家ChatGPT的创造者再次发力,推出了三款全新的自主研发语音模型,分别为:gpt-4o-transcribe, gpt-4o-mini-transcribe and gpt-4o-mini-tts。 其中最受瞩目的当属gpt-4o-transcribe。 目前,这些新模型已经率先通过应用程序接口(API)向第三方开发者开放,开发者们可以利用它们打造更智能的应用程序。
3/21/2025 9:01:00 AM
AI在线

OpenAI发布GPT-4.1系列模型:能力全面超越前代

4月15日,OpenAI 在其官方博客宣布正式发布 GPT-4.1系列模型,涵盖 GPT-4.1、GPT-4.1mini 和 GPT-4.1nano 三款子模型。 该系列在编程能力、指令理解及长文本处理等方面实现重大突破,全面超越前代 GPT-4o 及 GPT-4o mini。 其中,模型上下文窗口扩展至100万 tokens,知识库更新至2024年6月,为复杂任务提供更强支持。
4/15/2025 9:00:45 AM
AI在线