为需要模拟之外的团队提供真实的学习环境

持久的、可学习的机器人环境,由真实硬件、真实传感器以及对强化学习、评估和迭代的真实操作支持支持。

真实硬件 受控故障 可重复重置 基准就绪信号
这意味着什么

不是模拟器。 连续可操作的现实世界设置。

在我们的背景下,强化学习环境是一个完全指定的真实机器人系统:物理设置、明确定义的任务和成功标准、稳定的观察和行动空间、确定性的重置程序、连续记录以及在重复试验和失败下的安全执行。

这为团队提供了一个在现实世界中培训、评估和迭代基于学习的策略的场所,而不是将部署视为第一个真正的测试。

1

定义任务

锁定任务、成功标准、重置流程以及观察或操作界面。

2

进行重复试验

通过可重复的初始化在数千个剧集中操作相同的真实设置。

3

捕捉学习信号

记录关节状态、控制命令、视觉、触觉或力信号以及结果。

4

完善政策

使用真实的故障、真实的边缘情况和回归跟踪来迭代下一个版本。

我们提供什么

生产就绪环境组件

  • 持久的现实世界环境专用设置、重复事件执行、长期性能跟踪和操作安全支持。
  • 学习就绪信号联合状态、控制命令、本体感觉、RGB 和 RGB-D 视觉、力和触觉信号以及明确的结果标签。
  • 大规模可控故障安全捕获失败的抓取、滑倒、碰撞和恢复尝试作为一流数据。
示例环境

这个用在什么地方

  • 接触丰富的操纵 - 摩擦变化、触觉感知插入、滑动检测和恢复
  • 远程操作引导强化学习 - 人类演示加上在线或离线 RL 微调
  • 回归和基准环境 - 固定任务、可重复重置和版本控制的评估指标
参与模型

与 SVRC 合作的方式

  • 试点环境短期设置、可行性验证以及环境加任务协同设计。
  • 持久环境专用硬件和任务设置,可按月或按季度连续访问。
  • 一体化合作伙伴关系多种环境、持续的数据集增长、自定义指标和报告工作流程。

准备好开始了吗?

获取机器人、请求数据或伸出援手——我们随时为您提供帮助。