斗鱼体育DOUYU 复旦、CityUHK、SMU、UIUC等13家合资发布「具身智能安全」综述

具身智能（Embodied AI）正在快速从实验室走向真实全国。

自动驾驶汽车运转在城市谈路中穿梭，机械臂在工场里自主捏取和安设，做事机器东谈主缓缓参加病院、市集与家庭。与传统大模子不同，这些系统不再仅仅「在屏幕上言语」——它们正在平直团结传感器、驱动推论器，并对物理全国产生真实影响。

但与此同期，一个更深层、也更危急的问题正在浮现：当大模子运转驱动物理全国，当年那些「说错话」的安全风险，将第一次演变成「干错事」的推行风险。

关于聊天机器东谈主，一段逃狱教导词最坏可能仅仅生成无益文本；但关于机械臂、自动驾驶或机器东谈主系统，相似的挫折却可能平直滚动为危急动作，致使对推行全国酿成不成逆效果。

近日，来自复旦大学确切具身智能筹商院、上海创智学院、香港城市大学、新加坡管束大学、伊利诺伊大学、墨尔本大学、约翰霍普金斯大学、南洋理工大学、中科院自动化所等 13 家机构的 38 位学者，合资发布了迄今最系统的具身智能安全工夫综述，全文 70+ 页，粉饰近 480+ 篇筹商论文。

论文标题：Safety in Embodied AI: A Survey of Risks， Attacks， and Defenses

综述将具身智能分离为一个逐层递进的「五层才调圈」：感知、判辨、估计、行为与交互，以及 Agentic 系统，并提议了一个皆集全文的中枢洞悉——

2026世界杯赛事竞猜中国官网

「才调—风险」二象性（Capability-Risk Duality）

每加多一层才调，就会新增一层挫折面；才调越强，风险面也越广。

感知

这也组成了整篇综述的中枢组织逻辑。沿着五层才调圈，具身智能系统的风险正在从「数字全国」冉冉演化为「物理全国」：

在感知层（举例东谈主脸门禁系统），挫折者主要独揽传感器输入；

当系统具备判辨才调（举例博物馆导览机器东谈主），挫折面进一步扩张到语言运动与视觉推理；

当系统具备估计与闭环有联想才调（举例自动驾驶），挫折者致使不错干涉旅途有联想、轨迹磋议与及时适度；

当系统进一步具备复杂物理交互才调（举例机械臂、东谈主形机器东谈主），造作有联想将平直滚动为推行全国中的危急动作与物理伤害；

而当系统演化为具备牵记、器用调用、自主估计与不时进化才调的 Agentic 系统后，内层纵情一个缺欠，都可能沿着才调栈逐层级联放大。

换句话说，当年那些被孤单筹划的「抗击样本」「后门挫折」「逃狱挫折」，在具身智能时期将不再仅仅单点安全事件。

它们会沿着「感知—判辨—估计—行为」的才调链条束缚传递与放大，最终从一次模子造作，演变为一次真实全国中的系统性事故。

图 1：「才调—风险」二象性。才调栈每多一层，挫折面扩大一圈。

五层要挟，斗鱼体育中国官网一图看懂具身智能安全

综述进一步将分散的挫折与防患筹商斡旋到吞并套才调框架中，系统梳理了不同才调层对应的中枢挫折面与推行风险：

才调层

代表性挫折

真实全国效果

感知层

抗击样本、后门挫折、传感器骗取

讲理物漏检、住手标识误判、雷达骗取

判辨层

念念维链劫持、推理后门

空间运动造作、潦倒文诬陷、造作语义推理

估计层

任务逃狱、轨迹中毒、有联想独揽

不安全旅途估计、违背适度指示、机器东谈主闯入禁区

行为与交互层

适度抗击、东谈主机交互后门

机械臂撞东谈主、车辆失控、绕过安全契约

Agentic 系统层

器用 / 妙技花消、牵记投毒、牵记泄漏、级联失效

遥远不安全行为、隐讳泄漏、跨任务沾污、自进化对皆坍塌

图 2：具身智能 5 层才调栈中的挫折面与要挟分散。

这篇综述与已有责任不同在那里？

具身安全这两年涌现了一批综述（VLA Safety， Trustworthy EAI， World-Model Safety， LLM Robotics Security 等）。但绝大大量只看其中一层——

有的只筹商 VLA 模子的抗击鲁棒性；

有的只看导航场景下的庄重性；

有的只激情 LLM 适度机器东谈主时的教导注入；

还有的把安全手脚「IoT 系统中的一个组件」。

而这篇综述相持一个中枢态度：

必须端到端地看悉数 embodied pipeline，因为挫折会跨层级联。

它不仅整合了 embodied-specific 的责任，还从 vision、language、multimodal 基础模子安全筹商中筛选出与具身高度相干的责任，把「具身智能安全」放回更大的 AI 安全图景里。

被低估的几个筹商空缺

读这篇综述最值得保藏的部分，是它指出的几条简直没东谈主系统筹商的洞开问题：

多模态和会的脆弱性——和会越多模态，安全越复杂，但当今简直莫得针对和会层的攻防分析；

估计层在逃狱挫折下的褂讪性——LLM 当 planner，逃狱效果不再是「输出无益文本」，而是「机器东谈主运转推论无益任务」；

洞开场景下的东谈主机交互确切度——传统 HRI 安全假定交互是闭合的，但真实全国里的对话是洞开的；

Agentic 系统的级联失效旅途——牵记、器用、妙技、自进化之间若何相互沾污，当今贫困神情化框架。

这些每一条都足以撑起一个寥落的筹商标的。

不仅仅综述，更是一套社区资源

团队同期齰舌了齐备的洞开资源生态，包括：

Awesome-Embodied-AI-Safety GitHub 仓库（已收录 480+ 篇著述，按层级 + 子类组织，不时更新）；

神情网站：提供分类浏览、筹商统计与结构化阅读视图；

arXiv 双月更新机制：团队以双月节律同步最新 arXiv 责任，当今已纳入 HazardArena、RedVLA、JailWAM、IPI-in-Wild、MCP Function Hijacking、Skill Safety 等最新筹商。

关于激情具身智能安全的筹商者而言，这篇综述不仅是一份文件整理，更像是一张参加悉数限度的「导航舆图」。

写在终末

具身智能正在重新界说 AI 与推行全国的团结形式。

当一个模子不再仅仅「在屏幕上言语」，而运转真的参加物理全国——运转捏取、行走、操控、驾驶、交互、恒久牵记，致使自主进化——安全问题也正在发生根人性变化。

当年，模子「说错一句话」，效果经常仍停留在数字空间；

而在具身智能时期，一次感知偏差、一次估计造作、一次逃狱挫折，都可能最终演化为真实全国中的危急动作与系统性事故。

这意味着，安全照旧不再仅仅某一种挫折、某一个 Benchmark、某一篇论文能够单独惩办的问题。

它正在成为皆集感知、判辨、估计、行为与 Agentic 系统的底层问题。

而这篇综述最穷苦的少许，省略恰是它反复强调的那句话：

在具身智能时期，安全应当与才调同步联想，而不是过后打补丁。

要是你也在激情机器东谈主、自动驾驶与智能体若何真的走进推行全国斗鱼体育DOUYU，那么这篇综述，值得保藏。