RunHooks | AI 安全阻断防御系统

🛡️ 防御机制

重塑防御：RunHooks 机制

如同 Git Hooks 在代码提交前自动触发校验，RunHooks 在 AI 执行流的关键节点植入安全检查点，
对高风险操作进行实时识别与精准阻断。

Git Hooks — 代码安全守卫

# .git/hooks/pre-commit
if grep -r "password" staged_files; then
    echo "⛔ 检测到硬编码密码，提交已阻止"
    exit 1
fi

# .git/hooks/pre-push
if [ "$branch" = "main" ]; then
    run_tests || exit 1
fi

类比延伸

RunHooks — AI 安全守卫

# runhooks.config.yaml
hooks:
  pre_execute:
    - evaluate_prompt_safety
    - check_destructive_intent
  pre_access:
    - verify_identity_token
    - validate_permission_scope
  pre_request:
    - check_egress_rules
    - scan_payload_sensitivity

应用层 Hook App Layer

意图识别与指令解析。阻断类似 "rm -rf /", "DROP TABLE" 等高危语义，防止提示词注入攻击。

拦截规则示例：

deny: destructive_commands
deny: prompt_injection
audit: all_executions

pre_execute: evaluate_prompt_safety

接入层 Hook Access Layer

身份鉴权与越权拦截。即使 AI 生成了正确指令，也会校验执行上下文是否有权访问敏感资源。

校验规则示例：

require: valid_auth_token
scope: least_privilege
deny: cross_tenant_access

pre_access: verify_identity_token

网络层 Hook Network Layer

出向流量管控。拦截未经许可的向第三方服务器发送数据的请求，防止训练数据或用户隐私泄露。

管控规则示例：

allow: internal_endpoints_only
deny: external_data_transfer
audit: all_egress_traffic

pre_request: check_egress_rules

🔄 执行流程

RunHooks 拦截全流程：逐层阻断

AI 的每一次操作都必须穿过三道安全关卡，任何环节的异常都会被精准拦截并记录审计。

🤖

AI 发起请求

AI Agent 生成操作指令

🛡️

应用层 Hook

语义分析 · 意图校验 · 危险识别

✓ 指令安全性评分

✓ 提示词注入检测

✓ 破坏性操作识别

🔐

接入层 Hook

身份验证 · 权限校验 · 范围确认

✓ Token 有效性验证

✓ 最小权限原则检查

✓ 资源访问范围校验

🌐

网络层 Hook

流量监控 · 出向管控 · 数据防泄

✓ 出站目标白名单

✓ 数据敏感性扫描

✓ 请求频率限制

✅

安全执行

通过全部检查 · 允许操作

🎯 场景覆盖

全场景防御：主流 AI 工具全覆盖

RunHooks 客户端可安装于各类 AI 应用环境中，对不同 AI Agent 和 IDE 工具执行统一的安全拦截策略。

🐾

OpenClaw

AI Agent 平台

已适配

开源 AI Agent 框架，具备自主决策和工具调用能力。无约束运行时可能自主执行文件删除、数据库操作等破坏性行为。

🔴 自主删除文件

🔴 越权 API 调用

🟡 链式工具滥用

12 条拦截规则 App + Access Hook

⌨️

Cursor

AI IDE

已适配

AI 驱动的代码编辑器，可自动修改项目代码和执行终端命令。缺乏管控时可能误删关键文件或执行危险脚本。

🔴 危险代码执行

🔴 项目文件误删

🟡 依赖包篡改

18 条拦截规则 App + Network Hook

🏄

Windsurf

AI IDE

已适配

具备 Cascade 自主编码能力的 AI IDE，可直接运行终端命令和安装依赖。未受控时有执行高权限系统命令的风险。

🔴 未授权终端命令

🔴 系统文件访问

🟡 恶意包安装

15 条拦截规则 App + Access Hook

🤖

Claude Desktop

AI 助手

已适配

Anthropic 桌面 AI 助手，支持文件读写和 MCP 工具调用。若权限过宽可能上传敏感文件或越界访问本地文件系统。

🔴 敏感数据上传

🔴 文件系统越界

🟡 MCP 工具滥用

10 条拦截规则 Access + Network Hook

💬

ChatGPT Plugins

插件生态

适配中

OpenAI 插件生态允许 AI 调用第三方服务。恶意或有缺陷的插件可能窃取用户数据或执行未授权操作。

🔴 恶意插件调用

🔴 数据窃取泄露

🟡 权限提升攻击

8 条拦截规则 Network Hook

🔧

自定义 AI Agent

企业内部工具

可配置

企业自建的 AI Agent 或内部 Copilot 工具，通过 RunHooks SDK 集成，实现从代码层到网络层的全链路安全管控。

🔴 自定义策略防护

🟡 API 出站管控

🟢 全链路审计

自定义规则三层 Hook 全覆盖

🧑‍✈️

GitHub Copilot

AI 代码助手

已适配

AI 代码自动补全与生成工具，深度集成于 IDE，可自动建议和插入代码。存在将企业私有代码上传至云端训练、引入 License 违规代码段的风险。

🔴 私有代码泄露

🔴 License 违规

🟡 恶意代码注入

14 条拦截规则 App + Network Hook

💎

Gemini

Google AI 助手

已适配

Google 多模态 AI 助手，支持文本、图像、代码、视频分析。多模态上下文可能包含敏感截图、内部文档和 API 密钥，存在大规模数据泄露隐患。

🔴 多模态数据泄露

🔴 API 密钥暴露

🟡 上下文超范围

11 条拦截规则 Access + Network Hook

🔄

AutoGPT / AgentGPT

自主 AI Agent

已适配

完全自主运行的 AI Agent，可自主设定子目标、调用工具链、执行多步操作。无约束时可能陷入无限循环、耗尽计算资源或自主发起恶意网络请求。

🔴 无限循环执行

🔴 资源耗尽攻击

🟡 自主网络请求

20 条拦截规则三层 Hook 全覆盖

🔗

LangChain Agents

AI 编排框架

已适配

主流 AI 应用编排框架，支持工具链路、ReAct 推理和自定义 Agent。链式调用中恶意 Prompt 可逐层注入，导致任意代码执行或工具链被劫持。

🔴 链式工具注入

🔴 任意代码执行

🟡 数据序列化漏洞

16 条拦截规则 App + Access Hook

👨‍💻

Devin

AI 软件工程师

适配中

全自主 AI 软件工程师，可独立完成需求理解、编码、测试、部署全流程。具有直接操作生产环境、修改关键配置和推送代码的高危能力。

🔴 生产环境操作

🔴 代码库破坏

🔴 凭证泄露风险

22 条拦截规则三层 Hook 全覆盖

🌟

通义灵码

AI IDE 助手

已适配

阿里云 AI 编程助手，深度集成国内开发生态。可自动分析代码仓库结构、生成测试代码。需防范源码上传、项目结构泄露和供应链投毒风险。

🔴 源码外传风险

🔴 项目结构泄露

🟡 依赖投毒攻击

13 条拦截规则 App + Network Hook

🖥 打开 RunHooks 控制台

管理规则 · 订阅策略 · 配置 Agent

AI 能力觉醒，
风险随之而来

失控的AI：高风险场景还原

重塑防御：RunHooks 机制

应用层 Hook App Layer

接入层 Hook Access Layer

网络层 Hook Network Layer

RunHooks 拦截全流程：逐层阻断

AI 发起请求

应用层 Hook

接入层 Hook

网络层 Hook

安全执行

全场景防御：主流 AI 工具全覆盖

OpenClaw

Cursor

Windsurf

Claude Desktop

ChatGPT Plugins

自定义 AI Agent

GitHub Copilot

Gemini

AutoGPT / AgentGPT

LangChain Agents

Devin

通义灵码

实时防御：拦截实况演示

🚨 模拟高危操作请求

失控的AI：高风险场景还原

重塑防御：RunHooks 机制

应用层 Hook App Layer

接入层 Hook Access Layer

网络层 Hook Network Layer

RunHooks 拦截全流程：逐层阻断

AI 发起请求

应用层 Hook

接入层 Hook

网络层 Hook

安全执行

全场景防御：主流 AI 工具全覆盖

OpenClaw

Cursor

Windsurf

Claude Desktop

ChatGPT Plugins

自定义 AI Agent

GitHub Copilot

Gemini

AutoGPT / AgentGPT

LangChain Agents

Devin

通义灵码

实时防御：拦截实况演示

🚨 模拟高危操作请求

域名出售咨询