【今日要闻】人形机器人与自动驾驶的视觉感知技术革新与投资展望

386

2025-06-08 16:02:35

人形机器人热潮席卷全球，最强投资主线将是“视觉感知系统”?

高盛表示，人形机器人的视觉感知系统需要立体级别摄像头、ToF摄像头和激光雷达等3D深度技术，该行业发展有助于摄像头供应商摆脱竞争激烈的消费电子竞争市场，同时夜视、防碰撞与外力等新功能可提升产品均价。高盛在这份研报中予以 $地平线机器人-W (09660.HK)$ 与 $韦尔股份🐞·网址 (603501.SH)$ “买入”评级，同时予以在中国台湾股市上市的大立光电以及鸿海精密“买入”评级。高盛表示，地平线机器人2025年成立机器人子公司“地瓜机器人”，推出 Sunrise 5 SoC芯。

人形机器人与自动驾驶的视觉感知技术革新与投资展望

RobotSense: 智体科技开创视觉-语言-动作协同的Robotaxi决策新范式

该部分由三个子模块组成： 1.高效的视觉编码器：用于从图像中提取特征信息。可以使用 ViT、Swin Transformer 等 Transformer 模型提取图像特征，以提高图像处理的效率和准确性。2.Robotaxi视觉适配器：该视觉适配器将图像特征映射到 LLM 的特征空间，使其更适合被 LLM 理解和使用。具体方法是通过图🍍像查询对图像特征进行编码，并结合多头自注意力机制，捕捉不同视角图像特征之间的关联性，输出精简后的图像标记。3.LLM（大型语言模型）：通过 LLM。

中邮·机械|人形机器人系列专题（十）：视觉传感器——人形机器人视觉感知交互硬件

可以看到，不少人形机器人选用3D视觉方案以保证人形机器人的环境感知及交互能力。Boston Dynamics的Atlas采用RGB摄像头+ToF深度相机，优必选采用RGBD+双目相机，傅利叶的GR-1采用深度相机，开普勒的先行者系类采用3D视觉+鱼眼环视相机，小米的CyberOne配备了自研空间视觉模🍭组+AI交互相机。大部分案例均使用3D视觉传感器，各类型的深度相机被广泛使用，部分厂商的方案同时搭配了激光雷达，如Agility Robotics的Digit、宇树的H1、智元的。

RobotSense: 智体科技开创视觉-语言-动作协同的Robotaxi决策新范式

该部分由三个子模块组成： 1、高效的视觉编码器：用于从图像中提取特征信息。可以使用 ViT、Swin Transformer 等 Transformer 模型提取图像特征，以提高图像处理的效率和准确性。2、Robotaxi视觉适配器：该视觉🚁·网址适配器将图像特征映射到 LLM 的特征空间，使其更适合被 LLM 理解和使用。具体方法是通过图像查询对图像特征进行编码，并结合多头自注意力机制，捕捉不同视角图像特征之间的关联性，输出精简后的图像标记。3、LLM（大型语言模型）：通过 LLM。

思特威(688213.SH)SmartGS-2 Plus系列CMOS图像传感器产品，赋能智能机器人视觉系统

此外，SC038HGS、SC133HGS和SC233HGS可支持120fps的超高帧率，可以拓展应用于智能识别等机器人新型升级视觉应用摄像头模组，满足超低延迟的高效识别需求。图片来源：企业供图支持彩色版本定制多规格多元应用除主流机器人视觉感知应用的黑白(Mono)版本外，SC038HGS、SC133HGS与SC233HGS支持彩色版本定制，可适配更多不同应用场景，满足色彩识别功能需求。SC038HGS(0.3MP)、SC133HGS(1.3MP)与SC233HGS(2.3M。

推荐新闻

今日科普|10字：无锡视觉机器人方案

今日科普|10字：机器人视觉纠偏探秘

10字：汇川机器人视觉新篇

上一条：今日科普|机器人视觉技术探索

下一条：今日科普|巡检机器人视觉技术<

返回列表