灵初智能发布首个基于强化学习的端到端具身模型Psi R0
IT之家 12 月 30 日消息,灵初智能发布首个基于强化学习(RL)的端到端具身模型 Psi R0。
IT之家获悉,该模型支持双灵巧手协同进行复杂操作,将多个技能串联混训,生成具有推理能力的智能体,从而完成并闭环长程灵巧操作任务。并且,Psi R0 还可以实现跨物品、跨场景级别的泛化。
以电商场景为例,商品打包是典型的长程任务作业,需对上万件商品进行抓取,扫码,放置,塑料袋打结等多个操作。Psi R0 能够使用双灵巧手流畅地完成这一系列动作(官方称此系列动作在客户现场可以取代一个完整工位),成为首个基于强化学习训练完成长程灵巧操作任务的具身机器人。
官方表示,基于 RL 的 Psi R0 模型,使用海量仿真数据训练出双手操作的智能体,并通过双向训练框架串联多技能,在业界率先完成开放环境中的长程任务,具备较强的泛化能力与较高的鲁棒性(robustness)。
这一技能训练框架从物体时空轨迹抽象出关键信息以构建通用目标函数,从而解决奖励函数难设计的问题。在后训练阶段,通过少量高质量真机数据对齐,进一步提升长程任务的成功率。
除此之外,双向训练框架中的转移可行性函数发挥着重要作用,它能够微调技能以提高串联的成功率与泛化性,同时赋予模型自主切换技能的能力,使其在遭遇操作失败时能够迅速调整策略,确保高成功率。
上一篇:hp打印机墨水
下一篇:没有了
- 维修知识
- 安装知识
- 清洗保养
- 行业新闻
- 常见问题
- 电磁炉用什么锅12-30
- 12306新功能上线!最多预填60个车次12-30
- 冬天就不需要防晒了吗?丨中新真探12-30
- 康佳电视机维修12-30
- SAKURA地暖售后电话12-30
- 冰箱管冰堵怎么办?冰箱结冰堵塞了怎么办?12-30
- 无锡锅炉厂12-30
- 爱士达消毒柜售后服务电话12-30
- hp打印机墨水12-30
- 三菱空气源热泵售后维修12-30
- BSM风幕柜售后服务号码12-30
- 比力奇热水器维修电话12-30
- 德致商成保密柜售后维修电话是多少12-30
- 腾讯注册微信礼物商标12-30
- 春运期间,12306试点新功能12-30
- 澳颜莱地暖售后维修12-30
- 斐雪派可燃气灶售后24小时人工客服12-30
- DELOCK智能锁售后服务电话12-30
- 格洛尼锅炉售后电话12-30
- 水滴筹成为民政部指定个人求助网络服务平台12-30
- 美国前总统吉米·卡特去世 享年100岁12-30
- 尤勒凯弗消毒柜售后服务电话24小时12-30
- 神将安全门锁售后服务电话12-30
- Qirui太阳能售后电话24小时人工电话12-30
- 人为什么要结婚12-30
- 壁挂炉水压12-30
- 抢票不用定闹钟了!12306功能上新12-30
- 北泰智能保险柜24小时人工服务热线12-30
- 京东科技宣布明年将实现“全员平均20薪”12-30
- 什么是质数12-30
- 春泉热水器售后服务电话24小时12-30
- 素界保密柜24小时人工服务热线12-30