新闻资讯

【今日要闻】人形机器人与自动驾驶的视觉感知技术革新与投资展望

386
0
2025-06-08 16:02:35

人形机器人热潮席卷全球,最强投资主线将是“视觉感知系统”?

高盛表示,人形机器人的视觉感知系统需要立体级别摄像头、ToF摄像头和激光雷达等3D深度技术,该行业发展有助于摄像头供应商摆脱竞争激烈的消费电子竞争市场,同时夜视、防碰撞与外力等新功能可提升产品均价。高盛在这份研报中予以 $地平线机器人-W (09660.HK)$ 与 $韦尔股份🐞·网址 (603501.SH)$ “买入”评级,同时予以在中国台湾股市上市的大立光电以及鸿海精密“买入”评级。高盛表示,地平线机器人2025年成立机器人子公司“地瓜机器人”,推出 Sunrise 5 SoC芯。

人形机器人与自动驾驶的视觉感知技术革新与投资展望

RobotSense: 智体科技开创视觉-语言-动作协同的Robotaxi决策新范式

该部分由三个子模块组成: 1.高效的视觉编码器:用于从图像中提取特征信息。可以使用 ViT、Swin Transformer 等 Transformer 模型提取图像特征,以提高图像处理的效率和准确性。2.Robotaxi视觉适配器:该视觉适配器将图像特征映射到 LLM 的特征空间,使其更适合被 LLM 理解和使用。具体方法是通过图🍍像查询对图像特征进行编码,并结合多头自注意力机制,捕捉不同视角图像特征之间的关联性,输出精简后的图像标记。3.LLM(大型语言模型):通过 LLM。

中邮·机械|人形机器人系列专题(十):视觉传感器——人形机器人视觉感知交互硬件

可以看到,不少人形机器人选用3D视觉方案以保证人形机器人的环境感知及交互能力。Boston Dynamics的Atlas采用RGB摄像头+ToF深度相机,优必选采用RGBD+双目相机,傅利叶的GR-1采用深度相机,开普勒的先行者系类采用3D视觉+鱼眼环视相机,小米的CyberOne配备了自研空间视觉模🍭组+AI交互相机。大部分案例均使用3D视觉传感器,各类型的深度相机被广泛使用,部分厂商的方案同时搭配了激光雷达,如Agility Robotics的Digit、宇树的H1、智元的。

RobotSense: 智体科技开创视觉-语言-动作协同的Robotaxi决策新范式

该部分由三个子模块组成: 1、高效的视觉编码器:用于从图像中提取特征信息。可以使用 ViT、Swin Transformer 等 Transformer 模型提取图像特征,以提高图像处理的效率和准确性。2、Robotaxi视觉适配器:该视觉🚁·网址适配器将图像特征映射到 LLM 的特征空间,使其更适合被 LLM 理解和使用。具体方法是通过图像查询对图像特征进行编码,并结合多头自注意力机制,捕捉不同视角图像特征之间的关联性,输出精简后的图像标记。3、LLM(大型语言模型):通过 LLM。

思特威(688213.SH)SmartGS-2 Plus系列CMOS图像传感器产品,赋能智能机器人视觉系统

此外,SC038HGS、SC133HGS和SC233HGS可支持120fps的超高帧率,可以拓展应用于智能识别等机器人新型升级视觉应用摄像头模组,满足超低延迟的高效识别需求。图片来源:企业供图支持彩色版本定制 多规格多元应用除主流机器人视觉感知应用的黑白(Mono)版本外,SC038HGS、SC133HGS与SC233HGS支持彩色版本定制,可适配更多不同应用场景,满足色彩识别功能需求。SC038HGS(0.3MP)、SC133HGS(1.3MP)与SC233HGS(2.3M。