Anthropic呼吁放缓前沿AI研发警告自我改进风险

2026年06月05日 16:30

本文共计1450个字，预计阅读时长5分钟。

来源/财联社责编/huazi56 爱力方

财联社6月5日讯，编辑牛占林报道，美国人工智能公司Anthropic呼吁全球顶级AI实验室审慎放缓开发步伐，原因在于，AI系统正以极快的速度持续进步，这意味着它们可能很快就会在无需人工干预的情况下实现自我改进，进而对社会带来重大风险。

该公司周四在一篇博客文章中披露了其内部关于模型能力提升速度的相关数据，并表示，如果能够放缓全球AI开发的推进速度，那么这可能会是一件有利于全世界的事情。

这篇由Anthropic内部研究所负责人及政策主管撰写的文章指出，当前AI模型的进步似乎正朝着“递归式自我改进”的方向发展，也就是AI系统能够在无需人工干预的情况下自行实现提升。一些AI业内人士将这一门槛视为潜在危险信号开始显现、并可能引发巨大社会动荡的关键节点。

“文章指出，如果世界能够具备放缓或暂时暂停前沿AI开发的选项，从而使社会结构以及一致性研究能够跟上技术进步的步伐，那么这会是一件有益的事情。”文章还提出，应当就如何在潜在层面放缓开发达成全球协议，并建立一套用于核查竞争对手是否遵守该协议的机制。

Anthropic近期完成了一轮融资，估值已接近1万亿美元，同时提交了机密文件，以启动公开上市流程。作为ChatGPT制造商的OpenAI，预计也会很快提交IPO文件。

自成立以来，Anthropic始终把“AI安全”作为核心理念来坚持推进。但在较长一段时间里，也有批评者认为，该公司所提出的政策主张，实质上是在借助监管手段来限制竞争对手的发展速度。

风险投资家、特朗普的非正式顾问David Sacks曾公开指责Anthropic的领导层正在推动所谓的“监管俘获议程”。

还有一些观点认为，Anthropic就其自身工具潜在危险性所发出的警告，同样可以被看作一种营销手段。这些持怀疑态度的人指出，Anthropic决定限制发布其功能强大的Mythos模型，本身就是宣传其产品能力的一种便捷方式。

Anthropic的领导层则表示，其对安全问题始终予以认真对待，并持续致力于推动围绕相关风险展开更多讨论。

宾夕法尼亚大学沃顿商学院教授Ethan Mollick评论称：“Anthropic这篇文章中既包含一定程度的自我反思，也带有部分营销色彩，但更值得重视的是，Anthropic较为真诚地表达了其对未来AI发展走向的判断，而这些判断本身值得持续关注。”

Anthropic的领导层，包括首席执行官Dario Amodei，多年来持续警示AI可能引发的风险后果，并推动更广泛的社会协作，以共同应对相关风险。Amodei曾指出，AI不仅可能加剧不平等，还可能取代多达一半的入门级白领岗位。

Amodei还进一步警告称，在不久的将来，可能会出现更为强大的AI系统，而这类系统可能会以难以预测的方式演化出破坏性倾向。

周四发布的博客文章还指出，Anthropic研究所将与其他机构合作开展相关研究，以“帮助建立实现可信放缓或暂停所需的系统”。

文章指出，暂停或放缓只有在获得广泛遵守的前提下才具备实际意义，而这将需要建立一套核查机制，以确保所有相关方都已停止推进。该公司把这一问题类比为核武器条约，但也承认，防止作弊会更加棘手。

Anthropic计划在未来几个月与政策制定者、研究人员以及其他相关人士组织对话，以帮助回应围绕递归式自我改进和核查系统所提出的问题：“围绕这些问题开展共同研究的窗口期已经到来，AI公司之外的相关人士也应当参与到这一审议过程当中。”

来源：Anthropic呼吁全球放缓前沿AI研发警告“自我改进”风险 | 财联社

声明：本文来自财联社，版权归作者所有。文章内容仅代表作者独立观点，不代表爱力方立场，转载目的在于传递更多信息。如有侵权，请联系 copyright#agent.ren。

TAGS: []

通知

尊敬的用户

user

资讯

Anthropic呼吁放缓前沿AI研发警告自我改进风险

相关图文

这次AI热潮如何走向终局？褪去滤镜，别让故事战胜估值

Meta开始卖算力，机构的AI信仰变了吗？

“BAT”历史性同台！30亿美元“弹药”落定，可灵立下的5年IPO军令状，藏着资本对AI视频赛道的耐心上限

AI时代Token成为“统一度量衡” 业内呼吁合力解决计费不透明等问题

八部门推动工业互联网和算力基础设施同步建设宇树科技IPO注册获批

直击慕尼黑上海电子展：云端AI加速下沉至端侧

热门资讯

微软开源项目遭黑客入侵，多款AI开发工具被植入密码窃取软件

LabVLA：浙大与上海AI Lab联合探索科学具身智能，推动AI进入实验室

通义实验室联合开源首个统一科学大模型LOGOS，1B参数性能超越NatureLM

富士通推出PHOTON新架构，性能提升475倍以应对AI算力瓶颈

世界模型到底在建模什么

余承东发声，鸿蒙智能将迈向Agent时代

快讯

小艺Claw首次订阅即享7天0元体验，新用户限时专享500 AI点

德国黑森林实验室发布Flux3多模态模型，支持原生音频生成并实现20秒音视频同步输出

AIGC落地泛交通领域：地上铁解析新能源物流智能运营与全球化战略落地

阿里开源0.8B端到端文档解析模型OvisOCR2，登顶OmniDocBench v1.6

Claude 语音模式已切换 Claude 3 Opus：从随口问答升级为支持工具调用和语言切换的实时参谋

从赛场炫技到产业落地：机器人“运动员”是怎样炼成的？

腾讯推出WorkBuddy Bench：一套覆盖代码网页办公安全四个领域的编码智能体评测基准

大湾区首单H回A 越疆科技86天过会持续亏损叠加股权争议待解

GPT-Live 语音上线，ChatGPT 桌面端已安装“真人口吻”

人形机器人从“上场”到“进厂”——“人形机器人量产元年”新观察

推荐专栏

爱力方

机器人大讲堂

下一篇

user

资讯

Anthropic呼吁放缓前沿AI研发 警告自我改进风险

相关图文

这次AI热潮如何走向终局？褪去滤镜，别让故事战胜估值

Meta开始卖算力，机构的AI信仰变了吗？

“BAT”历史性同台！30亿美元“弹药”落定，可灵立下的5年IPO军令状，藏着资本对AI视频赛道的耐心上限

AI时代Token成为“统一度量衡” 业内呼吁合力解决计费不透明等问题

八部门推动工业互联网和算力基础设施同步建设 宇树科技IPO注册获批

直击慕尼黑上海电子展：云端AI加速下沉至端侧

热门资讯

微软开源项目遭黑客入侵，多款AI开发工具被植入密码窃取软件

LabVLA：浙大与上海AI Lab联合探索科学具身智能，推动AI进入实验室

通义实验室联合开源首个统一科学大模型LOGOS，1B参数性能超越NatureLM

富士通推出PHOTON新架构，性能提升475倍以应对AI算力瓶颈

世界模型到底在建模什么

余承东发声，鸿蒙智能将迈向Agent时代

快讯

小艺Claw首次订阅即享7天0元体验，新用户限时专享500 AI点

德国黑森林实验室发布Flux3多模态模型，支持原生音频生成并实现20秒音视频同步输出

AIGC落地泛交通领域：地上铁解析新能源物流智能运营与全球化战略落地

阿里开源0.8B端到端文档解析模型OvisOCR2，登顶OmniDocBench v1.6

Claude 语音模式已切换 Claude 3 Opus：从随口问答升级为支持工具调用和语言切换的实时参谋

从赛场炫技到产业落地：机器人“运动员”是怎样炼成的？

腾讯推出WorkBuddy Bench：一套覆盖代码网页办公安全四个领域的编码智能体评测基准

大湾区首单H回A 越疆科技86天过会 持续亏损叠加股权争议待解

GPT-Live 语音上线，ChatGPT 桌面端已安装“真人口吻”

人形机器人从“上场”到“进厂”——“人形机器人量产元年”新观察

推荐专栏

爱力方

机器人大讲堂

下一篇

Anthropic呼吁放缓前沿AI研发警告自我改进风险

八部门推动工业互联网和算力基础设施同步建设宇树科技IPO注册获批

大湾区首单H回A 越疆科技86天过会持续亏损叠加股权争议待解