

具身智能(Embodied AI)正在快速从实验室走向真实全国。
自动驾驶汽车运转在城市谈路中穿梭,机械臂在工场里自主捏取和安设,做事机器东谈主缓缓参加病院、市集与家庭。与传统大模子不同,这些系统不再仅仅「在屏幕上言语」——它们正在平直团结传感器、驱动推论器,并对物理全国产生真实影响。
但与此同期,一个更深层、也更危急的问题正在浮现:当大模子运转驱动物理全国,当年那些「说错话」的安全风险,将第一次演变成「干错事」的推行风险。
关于聊天机器东谈主,一段逃狱教导词最坏可能仅仅生成无益文本;但关于机械臂、自动驾驶或机器东谈主系统,相似的挫折却可能平直滚动为危急动作,致使对推行全国酿成不成逆效果。
近日,来自复旦大学确切具身智能筹商院、上海创智学院、香港城市大学、新加坡管束大学、伊利诺伊大学、墨尔本大学、约翰霍普金斯大学、南洋理工大学、中科院自动化所等 13 家机构的 38 位学者,合资发布了迄今最系统的具身智能安全工夫综述,全文 70+ 页,粉饰近 480+ 篇筹商论文。

论文标题:Safety in Embodied AI: A Survey of Risks, Attacks, and Defenses
综述将具身智能分离为一个逐层递进的「五层才调圈」:感知、判辨、估计、行为与交互,以及 Agentic 系统,并提议了一个皆集全文的中枢洞悉——
2026世界杯赛事竞猜中国官网「才调—风险」二象性(Capability-Risk Duality)
每加多一层才调,就会新增一层挫折面;才调越强,风险面也越广。
感知
这也组成了整篇综述的中枢组织逻辑。沿着五层才调圈,具身智能系统的风险正在从「数字全国」冉冉演化为「物理全国」:
在感知层(举例东谈主脸门禁系统),挫折者主要独揽传感器输入;
当系统具备判辨才调(举例博物馆导览机器东谈主),挫折面进一步扩张到语言运动与视觉推理;
当系统具备估计与闭环有联想才调(举例自动驾驶),挫折者致使不错干涉旅途有联想、轨迹磋议与及时适度;
当系统进一步具备复杂物理交互才调(举例机械臂、东谈主形机器东谈主),造作有联想将平直滚动为推行全国中的危急动作与物理伤害;
而当系统演化为具备牵记、器用调用、自主估计与不时进化才调的 Agentic 系统后,内层纵情一个缺欠,都可能沿着才调栈逐层级联放大。
换句话说,当年那些被孤单筹划的「抗击样本」「后门挫折」「逃狱挫折」,在具身智能时期将不再仅仅单点安全事件。
它们会沿着「感知—判辨—估计—行为」的才调链条束缚传递与放大,最终从一次模子造作,演变为一次真实全国中的系统性事故。

图 1:「才调—风险」二象性。才调栈每多一层,挫折面扩大一圈。
五层要挟,斗鱼体育中国官网一图看懂具身智能安全
综述进一步将分散的挫折与防患筹商斡旋到吞并套才调框架中,系统梳理了不同才调层对应的中枢挫折面与推行风险:
才调层
代表性挫折
真实全国效果
感知层
抗击样本、后门挫折、传感器骗取
讲理物漏检、住手标识误判、雷达骗取
判辨层
念念维链劫持、推理后门
空间运动造作、潦倒文诬陷、造作语义推理
估计层
任务逃狱、轨迹中毒、有联想独揽
不安全旅途估计、违背适度指示、机器东谈主闯入禁区
行为与交互层
适度抗击、东谈主机交互后门
机械臂撞东谈主、车辆失控、绕过安全契约
Agentic 系统层
器用 / 妙技花消、牵记投毒、牵记泄漏、级联失效
遥远不安全行为、隐讳泄漏、跨任务沾污、自进化对皆坍塌

图 2:具身智能 5 层才调栈中的挫折面与要挟分散。
这篇综述与已有责任不同在那里?
具身安全这两年涌现了一批综述(VLA Safety, Trustworthy EAI, World-Model Safety, LLM Robotics Security 等)。但绝大大量只看其中一层——
有的只筹商 VLA 模子的抗击鲁棒性;
有的只看导航场景下的庄重性;
有的只激情 LLM 适度机器东谈主时的教导注入;
还有的把安全手脚「IoT 系统中的一个组件」。
而这篇综述相持一个中枢态度:
必须端到端地看悉数 embodied pipeline,因为挫折会跨层级联。
它不仅整合了 embodied-specific 的责任,还从 vision、language、multimodal 基础模子安全筹商中筛选出与具身高度相干的责任,把「具身智能安全」放回更大的 AI 安全图景里。
被低估的几个筹商空缺
读这篇综述最值得保藏的部分,是它指出的几条简直没东谈主系统筹商的洞开问题:
多模态和会的脆弱性——和会越多模态,安全越复杂,但当今简直莫得针对和会层的攻防分析;
估计层在逃狱挫折下的褂讪性——LLM 当 planner,逃狱效果不再是「输出无益文本」,而是「机器东谈主运转推论无益任务」;
洞开场景下的东谈主机交互确切度——传统 HRI 安全假定交互是闭合的,但真实全国里的对话是洞开的;
Agentic 系统的级联失效旅途——牵记、器用、妙技、自进化之间若何相互沾污,当今贫困神情化框架。
这些每一条都足以撑起一个寥落的筹商标的。
不仅仅综述,更是一套社区资源
团队同期齰舌了齐备的洞开资源生态,包括:
Awesome-Embodied-AI-Safety GitHub 仓库(已收录 480+ 篇著述,按层级 + 子类组织,不时更新);
神情网站:提供分类浏览、筹商统计与结构化阅读视图;
arXiv 双月更新机制:团队以双月节律同步最新 arXiv 责任,当今已纳入 HazardArena、RedVLA、JailWAM、IPI-in-Wild、MCP Function Hijacking、Skill Safety 等最新筹商。
关于激情具身智能安全的筹商者而言,这篇综述不仅是一份文件整理,更像是一张参加悉数限度的「导航舆图」。
写在终末
具身智能正在重新界说 AI 与推行全国的团结形式。
当一个模子不再仅仅「在屏幕上言语」,而运转真的参加物理全国——运转捏取、行走、操控、驾驶、交互、恒久牵记,致使自主进化——安全问题也正在发生根人性变化。
当年,模子「说错一句话」,效果经常仍停留在数字空间;
而在具身智能时期,一次感知偏差、一次估计造作、一次逃狱挫折,都可能最终演化为真实全国中的危急动作与系统性事故。
这意味着,安全照旧不再仅仅某一种挫折、某一个 Benchmark、某一篇论文能够单独惩办的问题。
它正在成为皆集感知、判辨、估计、行为与 Agentic 系统的底层问题。
而这篇综述最穷苦的少许,省略恰是它反复强调的那句话:
在具身智能时期,安全应当与才调同步联想,而不是过后打补丁。
要是你也在激情机器东谈主、自动驾驶与智能体若何真的走进推行全国斗鱼体育DOUYU,那么这篇综述,值得保藏。