具身小组
具身智能研究小组隶属于赛尔实验室语言分析组,致力于深入探索具身智能领域的前沿问题,特别是在代码与智能交互、视觉推理、数据构建等方面的创新性研究。我们的小组以代码为切入点,研究如何通过技术推动具身智能的实现与发展,探索智能体在物理世界中的感知与认知能力。
研究方向
- 数据构建:我们专注于高质量数据集的构建和优化,旨在为具身智能研究提供强有力的基础支持。通过创新的数据构建方法,提升模型的泛化能力和推理精度。
- 视觉推理:我们研究如何通过视觉推理技术将图像或视频信息转化为可操作的代码,推动智能体在视觉理解和行为执行之间的无缝衔接。
- 视觉编码器:开发高效的视觉编码器,提升计算机视觉模型的理解与处理能力,以便更好地支持具身智能系统在复杂环境中的决策和执行能力。
- VLA基座模型:探索VLA(Visual Language Agent)模型,研究如何通过视觉与语言的结合提升智能体的跨模态推理能力,使其能够处理更复杂、更抽象的任务。
- 基于代码的规划:我们研究如何利用代码来更好地完成具身智能的规划任务,通过代码驱动的规划方法,提高智能体在动态环境中决策、行动和适应的能力。
我们的小组将在具身智能的广泛应用场景中,推动前沿技术的突破,力求实现更加智能、灵活的计算系统,推动人工智能走向更加真实和复杂的物理世界。