Transformer 论文作者“菠萝哥”重造“龙虾”：Rust 搓出钢铁版，告别 OpenClaw 裸奔漏洞

抖音秀百科资讯 2026-03-06 16:22:39 5

有多少龙虾在互联网上裸奔？AI 智能体带着你的密码和 API 密钥暴露给全网。

Transformer 作者 Illia Polosukhin 看不下去了。出手从零重构了安全版龙虾：IronClaw。

功能

OpenClaw

IronClaw

核心语言

Python

Rust

凭证处理

直接暴露给 AI 智能体

加密存储，LLM 无法访问

工具执行

在主环境中运行

WASM 沙箱隔离运行

部署环境

标准服务器

可信执行环境（TEE）

数据隐私

存在泄露风险

本地加密，无遥测数据

IronClaw 目前已在 GitHub 上开源，提供 macOS、Linux 和 Windows 的安装包，支持本地部署，也支持通过云端托管。项目仍处于快速迭代阶段，v0.15.0 版本的二进制文件已可下载。

Polosukhin（以下简称菠萝哥）还在 Reddit 论坛开贴回应一切，关注度颇高。

OpenClaw 火了，但也“着火”了

菠萝哥本人也是 OpenClaw 的早期使用者，并称这是他等了 20 年的技术。

它已经改变了我与计算交互的方式。

然而 OpenClaw 的安全状况堪称灾难，一键式远程代码执行、提示注入攻击、恶意技能窃取密码，这些漏洞在 OpenClaw 的生态系统中被逐一曝光。

超过 25000 个公开实例在没有充分安全控制的情况下暴露在互联网上，被安全专家直接称为「安全垃圾火灾（security dumpster fire）」。

问题的根源在于架构本身。

当用户将自己的邮箱 Bearer Token 交给 OpenClaw 时，会被直接送入 LLM 提供商的服务器。

菠萝哥在 Reddit 上指出这意味着什么：

你所有的信息，甚至包括你没有明确授权的数据，都可能被该公司的任何员工访问到。这同样适用于你雇主的数据。不是说这些公司有恶意，但现实就是用户没有真正的隐私。

他表示，再多的便利也不值得拿自己和家人的安全与隐私去冒险。

用 Rust 从零重建一切

IronClaw 是用 Rust 语言对 OpenClaw 的完全重写。

Rust 的内存安全特性能从根本上消除缓冲区溢出等传统漏洞，这对于需要处理私钥和用户凭证的系统至关重要。

在安全架构上，IronClaw 建立了四层纵深防御。

第一层是 Rust 本身提供的内存安全保证。
第二层是 WASM 沙箱隔离，所有第三方工具和 AI 生成的代码都在独立的 WebAssembly 容器中运行，即使某个工具是恶意的，其破坏范围也被严格限制在沙箱之内。
第三层是加密凭证保险库，所有 API 密钥和密码都使用 AES-256-GCM 加密存储，每一条凭证都绑定了策略规则，规定它只能用于特定域名。
第四层是可信执行环境（TEE），利用硬件级别的隔离保护数据，即使是云服务提供商也无法访问用户的敏感信息。

这套设计中最关键的一点是：大模型本身永远接触不到原始凭证。

只有当智能体需要与外部服务通信时，凭证才会在网络边界被注入。

菠萝哥举了一个例子，即使大模型被提示注入攻击，试图将用户的 Google OAuth 令牌发送给攻击者，凭证存储层也会直接拒绝这个请求，记录日志，并向用户发出警报。

然而开发者社区还是不放心，毕竟 OpenClaw 有 2000 多个公开实例被攻击，以及存在大量恶意技能，IronClaw 一旦走红会不会重蹈覆辙？

菠萝哥的回应是，IronClaw 的架构设计已经从根本上堵住了 OpenClaw 的核心漏洞。凭证始终加密存储且从不接触 LLM，第三方技能无法在主机上执行脚本，只能在容器内部运行。

即便通过 CLI 访问，也需要用户的系统钥匙串来解密，拿到的加密密钥本身没有意义。

他同时表示，随着核心版本趋于稳定，团队计划进行红队测试和专业安全审查。

关于提示注入这个业界公认的难题，菠萝哥给出了更详细的思路。

当前 IronClaw 使用启发式规则进行模式检测，未来目标是部署一个可持续更新的小型语言分类器来识别注入模式。

但他也承认，提示注入不仅可能窃取凭证，还可能直接篡改用户的代码库或通过通讯工具发送恶意消息。

应对这类攻击需要一套更智能的策略系统，能够在不查看输入内容的情况下审查智能体的行为意图，“还需要更多工作，欢迎社区贡献”。

有人问到本地部署和云端部署的取舍。