当前位置:CRM > 互联网资讯 > Think2Drive:首个用于自动驾驶的基于模型的RL方法(上海交大)

Think2Drive:首个用于自动驾驶的基于模型的RL方法(上海交大)

2024-02-29 12:01:45互联网资讯
2024-02-29,

本文经自动驾驶之心公众号授权转载,转载请联系出处。

在CARLA v2中以专家级的熟练程度运行。

题目:Think2Drive: Efficient Reinforcement Learning by Thinking in Latent World Model for Quasi-Realistic Autonomous Driving (in CARLA-v2)

作者单位:上海交通大学

现实世界中的自动驾驶(AD),尤其是城市驾驶,涉及许多corner case。最近发布的AD仿真器CARLA v2在驾驶场景中增加了39个常见事件,并提供了比CARLA v1更接近真实的测试平台。这给社区带来了新的挑战,到目前为止,还没有文献报告CARLA v2中的新场景取得了任何成功,因为现有的工作大多都必须依赖于特定规则进行规划,但它们无法涵盖CARLA v2中更复杂的情况。这项工作主动直接训练一个规划器,希望能够灵活有效地处理corner case,认为这也是AD的未来方向。据我们所知,我们开发了第一个基于模型的强化学习方法,名为Think2Drive,用于AD,具有一个世界模型来学习环境的转变,然后它充当神经仿真器来训练规划器。这种范式极大地提高了训练效率,因为世界模型中的低维状态空间和张量的并行计算。

结果,Think2Drive能够在单个A6000 GPU上进行3天的训练后,在CARLA v2中以专家级的熟练程度运行,据我们所知,迄今为止尚未报告有关CARLA v2的成功(100%的路线完成)。还提出了CornerCase-Repository,这是一个支持通过场景评估驾驶模型的基准。此外,提出了一个新的平衡指标来评估性能,包括路线完成、违规次数和场景密度,以便驾驶分数可以提供更多关于实际驾驶表现的信息。

实验结果

写在最后

欢迎star和follow我们的仓库,里面包含了BEV/多模态融合/Occupancy/毫米波雷达视觉感知/车道线检测/3D感知/多模态融合/在线地图/多传感器标定/Nerf/大模型/规划控制/轨迹预测等众多技术综述与论文;

PS:本文来源:Think2Drive:首个用于自动驾驶的基于模型的RL方法(上海交大),自动驾驶,模型,人工智能,作者:汽车人

版权声明:我们致力于保护作者版权,注重分享,本文内容及图片(只作为美观性配图使用)由CRM小助手整理收集与网络(无任何非法侵犯第三方意图),仅供学习参考交流使用,不代表CRM论坛观点。如有侵权,请联系我们,我们将及时删除处理。

CRM论坛投稿:投稿地址


  CRM论坛(CRMBBS.COM)始办于2019年,是致力于CRM实施方案、免费CRM软件、SCRM系统、客户管理系统的垂直内容社区网站,CRM论坛持续专注于CRM领域,在不断深化理解CRM系统的同时,进一步利用新型互联网技术,为用户实现企业、客户、合作伙伴与产品之间的无缝连接与交互。

CRM系统