理工学院师生共7篇论文被机器人与智能系统领域顶会之一IROS 2025接收
近日,香港中文大学(深圳)理工学院共有7篇论文被IEEE智能机器人与系统国际会议(IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS 2025)接收。
在被接收的论文中,作者包括理工学院:
在读硕士生—成就、林泽昕、王陈炜、吴东昊
在读博士生—李绍铭、钱程、王浩、徐映天
硕士毕业生—蔡昌亨、万瀚文
博士毕业生—季广霖
通讯作者或指导老师为理工学院朱建副教授、孙正隆助理教授、钟仿洵助理教授、冀晓强研究助理教授。
会议介绍
IEEE智能机器人与系统国际会议(IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS) 是机器人与智能系统领域最著名、影响力最大的顶级学术会议。
作为国际机器人与自动化领域的两大影响最大的学术会议之一,自机器人技术发展初期的1988年开始,IROS每年举办一届。每年,来自世界各个顶尖机器人研究机构的专家和业界人士汇聚在这个盛会,探讨和展示机器人行业最前沿的技术。IROS 2025共收到来自66个国家/地区的4306篇论文投稿,以及来自IEEE期刊(TRO, RAL, RAM, TASE, TIE, TII, TMech)转载的论文777篇,最终接收论文共计1991篇,接收率为46%。
论文介绍
论文一
题目:Modeling of Viscoelastic Liquid Crystal Elastomer Actuators
摘要:近年来,传统导管技术已在神经介入手术中展现出临床实用性,但脑血管系统的曲折性对外科医生的专业技能提出了极高的要求,需要通过手动操作克服复杂的解剖结构。为了通过降低技术门槛和优化手术效率来推进神经介入实践,实现具有更高灵活性的主动可操控导管已成为一项关键目标。液晶弹性体作为软体驱动器具有大变形和多种驱动模式等独特特性,有助于实现柔性医用微导管的可控弯曲,提高其在医疗过程中的可操作性。然而该驱动器表现出明显的迟滞特性,其建模控制有很大挑战。本文提出了一个动力学模型来描述光激励液晶弹性体驱动器的非线性时变表现。首先建立输入激光功率与软驱动器温度响应的非线性关系,并应用粘弹性模型拟合其形变的迟滞特性,然后基于伸缩型驱动器,采用灰箱模型辨识算法拟合未知参数,验证了该模型的可靠性,最终应用于弯曲型驱动器中,实现了较好的前馈控制效果。此外,该工作也为未来多驱动器组合的全向弯曲微导管的实时控制奠定了基础。
理工学院参与作者:
第一作者:王浩,2020级计算机与信息工程专业在读博士生。
通讯作者:朱建,香港中文大学(深圳)理工学院副教授,深圳市人工智能与机器人研究院兼职研究员。
论文二
题目:Multimodal Deformation Estimation of Soft Pneumatic Gripper During Operation
摘要:许多机器人任务都需要知晓机器人精确的三维几何结构,然而,软体机器人的结构无法通过一组有限的可测参数(如关节角度和连杆长度)推算。这就使得精确掌握软体机器人三维几何形态极为困难,难以完成复杂的接触型操作任务,阻碍了广泛使用。为攻克这一难题,我们首先设计了能够突破传统单轴弯曲的局限的双腔道气动执行器,其具有高自由度和腔室间耦合交互的特性。其次,我们提出了一种低成本且低侵入性的传感器设置模式,复用腕部摄像头视觉信号并使用尖端IMU信号融合补足,再基于物理模型和数据可得性计算夹爪的几何点云模型,本体感受几何分辨率(PGR)达到558;然后,我们使用结合了注意力机制LSTM网络的深度学习架构融合多模态进行形态学重建。我们的方法关键点预测的平均误差为 3.67 毫米(方差为 8.39),相比之下,仅使用视觉信号的平均误差为 4.36 毫米(方差 10.47),而仅使用IMU的平均误差为9.32 毫米(方差 21.29)。这项工作为软体机器人在复杂环境中的自主操作提供了新的可能性,为服务机器人、康复机器人及人机协作等领域的实际应用铺平了道路。
理工学院参与作者:
第一作者:蔡昌亨,2025届计算机与信息工程专业硕士毕业生。
通讯作者:朱建,香港中文大学(深圳)理工学院副教授,深圳市人工智能与机器人研究院兼职研究员。
论文三
题目:Towards Fully Autonomous Robotic Ultrasound-guided Biopsy for Superficial Organs
摘要:为应对超声引导治疗中对医生技能高度依赖、培训成本高及专业医师短缺等挑战,该工作提出了一种面向浅表器官穿刺的自主机器人系统。该系统集成了超声探头与自动进针机构,可在无需人工干预的情况下,按照临床操作流程完成实时图像导航与穿刺取样操作。通过非线性优化方法,系统实现了2D超声图像与3D体积数据之间的实时切片-体积配准,并辅助医生选择目标图像平面。在精准定位目标后,系统自主完成穿刺与取样流程。
系统整体设计充分结合了临床操作规范与3D解剖先验,实现了从图像获取、配准导航到穿刺执行的完整闭环。本文还提出了一种在精度与实时性之间取得平衡的导航方法,显著提升了目标定位的准确性与穿刺的可靠性。实验验证结果表明,该系统在多种场景下均表现出良好的可行性、鲁棒性与泛化能力,为超声引导治疗的智能化与自动化提供了全新解决方案。该工作为面向实际应用的智能医疗机器人系统提供了有力支撑。
图:自主超声引导穿刺活检工作流程:1)3D解剖结构预处理;2)基于配准的视觉伺服和导航;3)细针穿刺活检
图:多浅表器官体模(左:甲状腺,右:乳腺)全流程实验评估
理工学院参与作者:
第一作者:王陈炜,2023级计算机与信息工程专业在读硕士生。
共同一作:钱程,2024级计算机与信息工程专业在读博士生。
通讯作者:孙正隆,香港中文大学(深圳)理工学院助理教授,校长青年学者,博士研究生导师。
论文四
题目:High-dynamic Tactile Sensing for Tactile Servo Manipulation: Let Robots Swing a Hammer
摘要:本研究聚焦于高动态触觉感知与伺服控制的实时性与鲁棒性挑战,以机器人钉钉子任务为例,通过允许锤子在刚性双指夹爪中受控滑动,指间的触觉系统能够实时感知连续滑动,并据此动态调节夹紧力。动态滑动触觉伴随着震动与高频信号,触觉传感器感知频率为1 kHz,论文采用短时傅里叶变换(STFT)与双流物理知识引导机器学习(PIML)模型,提取高频触觉特征并降低反馈延迟,平均延迟仅为1.04 ms。系统采用鼓励旋转滑动增强冲击力并吸收反冲,抑制平行滑动以维持夹持稳定性的动态调整策略。
实验表明,该方法相比传统将锤子刚性固定的方式,在增强冲击力(提升179.97%,从28.06 N提升至78.56 N)和减少反冲(下降64.26%,从223.30 N降至79.81 N)方面表现显著。该方法还适配不同质量分布的锤子,展现出优越的操作灵活性和动态适应能力。研究成果为高动态触觉交互任务提供了有效的新思路。
图:锤击过程中动态握持与刚性握持的受力比较
理工学院参与作者:
第一作者:徐映天,2021级计算机与信息工程专业博士研究生,研究方向为机器人触觉感知与应用。
通讯作者:孙正隆,香港中文大学(深圳)理工学院助理教授,校长青年学者,博士研究生导师。
论文五
题目:An Open-Source Snake Hole-Digging Inspired Safety-Critical Insertion Planning and Replanning Framework for Continuum Robots
摘要:本论文提出了一种受蛇类挖洞行为启发的开源安全关键插入规划与重规划框架,用于多节段连续体机器人在动态环境中的运动控制。论文的主要贡献包括:蛇类挖洞行为(图4)启发的最优插入规划框架:与传统的前导跟随(FTL)运动不同,该框架利用所有节段调整整体构型,而不仅依赖远端节段引导运动。通过逆向运动规划(Algorithm 1),机器人在插入过程中逐步拟合预规划的最终形状,显著降低了与目标路径的平均偏差,与传统方法相比提升75.36%)。
实时全局避障与目标跟踪:通过将控制屏障函数(CBF)和控制李雅普诺夫函数(CLF)集成到二次规划(QP)框架中(CLF-CBF-Q),实现了动态障碍物环境下的在线运动重规划。实验显示,CLF-CBF-QP在移动障碍物干扰下仍能保证机器人末端到达目标位置(图7),其平均误差比仅用CBF-QP降低了48.43%。
图:蛇类挖洞行为
图:利用Adjusting space调整全局位姿
图:逆向运动规划:从最终姿态规划到初始姿态全过程
图:CLF-CBF-QP与CBF-QP动态避障对比
开源实现:论文提供了完整的开源代码,涵盖运动规划、避障算法及仿真测试模块,为连续体机器人社区的研究与应用提供了实用工具,详情请见:https://github.com/bentferrari/Online-Planning-CR
理工学院参与作者:
第一作者:季广霖,2025届博士毕业生,博士期间主要从事连续体机器人控制以及运动规划研究工作。其研究成果发表在IEEE Transactions on Robotics, IEEE Transactions on Industrial Electronics, IEEE Robotics and Automation Letters, IEEE IROS, IEEE AIM, IEEE EMBC,Cyborg and Bionic Systems等国际知名期刊与会议。
通讯作者:孙正隆,香港中文大学(深圳)理工学院助理教授,校长青年学者,博士研究生导师。
论文六
题目:Efficient Underwater Object Detection With Enhanced Feature Extraction and Fusion(高效水下目标检测与增强的特征提取和融合)
摘要:水下目标检测在环境监测、资源勘探和自主水下航行器(AUV)导航等领域至关重要。然而,由于水下成像条件嘈杂、光照多变和背景复杂,精确检测小型目标仍然充满挑战。针对这些难题,本文提出了一个名为“自适应残差注意力网络”(ARAN)的优化深度学习框架,旨在增强对复杂水下环境中微小目标的检测与精确识别能力。
ARAN框架的核心是一个创新的“融合PANet”(Fusion PANet),它通过有效地区分目标与背景来优化空间特征。该框架集成了三个关键的新模块:(1)多尺度特征注意力(Multi-Scale Feature Attention, MFA),用于增强低级特征的提取;(2)高低特征残差学习(High-Low Feature Residual Learning, HFRL),通过跨维度交互捕捉像素级关系;(3)自适应多级特征聚合(Adaptive Multi-Level Feature Aggregation, AMFA),动态调整融合权重,以促进渐进式多级特征融合,并缓解多尺度集成中的冲突,确保小目标不会被忽略。
在四个基准数据集上的大量实验证明,ARAN的性能显著优于主流模型。特别是在CSIRO数据集上,ARAN实现了98%的mAP50,精确率、F2分数和召回率均达到94.7%。这些结果证实了该模型在水下目标检测方面具有卓越的准确性、鲁棒性和效率,凸显了其在复杂水下环境中实际部署的巨大潜力。
图:网络结构
图:识别结果
理工学院参与作者:
第一作者:李绍铭,2024级计算机与信息工程专业在读博士生,导师为理工学院钟仿洵教授。主要研究方向为基于学习的三维感知与交互、医疗机器人视觉导航。
通讯作者:钟仿洵,香港中文大学(深圳)理工学院助理教授,人工智能学院兼职教授,博士生导师(副研究员),校长青年学者。
由钟仿洵教授作为组织者之一的研讨会“Soft Tissue Manipulation In Robotic Surgery(面向机器人辅助手术的软组织自主操控技术)”也被IROS 2025接收,研讨会将探讨机器人软组织操作的前沿挑战与最新进展。组织安全操作是最常见的普外科手术类型之一,其自动化对于进一步提升机器人手术的精确性、可靠性和安全性至关重要。近年来,机器人软组织操作虽已取得重大突破,但由于软组织固有的复杂性(如非线性弹性、不同组织及患者间的力学特性差异等),要实现稳定可靠的操作仍面临诸多挑战。研讨会将重点围绕精确建模与仿真、实时感知与交互、鲁棒控制策略、机器人设计、智能决策能力等关键领域展开讨论。详情请见:https://sites.google.com/view/iros25-softtissuemanipulation/home
论文七
题目:EmbodiedAgent: A Scalable Hierarchical Approach to Overcome Practical Challenge in Multi-Robot Control
摘要:本文提出了 EmbodiedAgent,一个面向异构多机器人的分层控制框架,旨在解决大模型在处理反物理事实任务时易产生幻觉的问题。该方法融合了下一步动作预测范式与结构化记忆系统,能够将复杂任务动态分解为可物理性执行的机器人技能,并实时验证动作是否符合环境约束。
为支持训练与评估,我们构建了 MultiPlan+ 数据集,涵盖 100 个场景、超过18,000条带注释的规划实例,其中包含部分反事实任务,用于缓解幻觉风险。除此之外,本文提出了机器人规划评估框架(RPAS),结合自动化指标与大语言模型辅助的专家评估,以全面衡量模型性能。实验结果显示,EmbodiedAgent 在多个基准任务中均优于现有先进方法,RPAS 得分达到 71.85%,并在真实办公服务任务中展现出多机器人的长时序协作控制与执行能力。
图:EmbodiedAgent的渠道
理工学院参与作者:
第一作者:万瀚文,2025届计算机与信息工程专业硕士毕业生,即将继续攻读计算机与信息工程专业博士学位,导师为理工学院冀晓强教授。主要研究方向为具身智能控制、大模型和强化学习控制等。
独立通讯作者:冀晓强,香港中文大学(深圳)理工学院研究助理教授,东盟-中国人工智能实验室首席科学家。
其他作者包括理工学院硕博学生:林泽昕、吴东昊、成就
