Data exfiltration vulnerability
可以先理解为:工具被提示注入利用导致数据外泄的风险
模型不一定直接说出秘密,但可能被诱导把秘密塞进一次工具请求里。
关键结构图
中心节点写「Data exfiltration vulnerability」,周围连接 Agent Infra、Guardrails、Trusted access,用细线表示相邻路径和调用方向。
What
Data exfiltration vulnerability 是 agent 工具调用风险:恶意提示或外部内容诱导模型调用工具,把私密数据嵌入 URL、请求参数或外部服务,造成外泄。
When
当你需要判断某个 AI 能力是否需要额外控制、验证或分级开放时,可以用「Data exfiltration vulnerability」命名这块砖,再连接相邻概念继续判断。
How
这块砖提醒 agent 安全要看完整链路:输入、工具、权限、网络请求和日志都会变成攻击面。
Examples
在设计或评估高能力 AI 的防护边界时,你可以用「Data exfiltration vulnerability」标记其中最需要被看见的结构,再检查它提供了什么证据、边界或行动方向。
在整理「AI 安全」主题时,把「Data exfiltration vulnerability」和「Agent Infra」放在同一路径里,可以帮助读者从单点概念走向可复用的判断框架。
来源
类型:安全框架 / 概念整理
事实线:这张卡把「Data exfiltration vulnerability」整理为概念提炼: Data exfiltration vulnerability 是 agent 工具调用风险:恶意提示或外部内容诱导模型调用工具,把私密数据嵌入 URL、请求参数或外部服务,造成外泄。
依据:1000 Bricks 本地砖块库的概念定义、相邻砖块关系和AI 安全治理、能力评估和风险控制讨论。
边界:适用于「AI 风险治理、能力边界、防御策略和安全控制」主题下的理解、复盘和设计判断;不等于行业统一标准或对所有场景都成立的结论。
常见误读:不要把它当作某篇材料的原文摘要,也不要因为概念名清晰就忽略具体情境和验证证据。