当前位置:CRM
> 自动驾驶 第11页
HiLM-D:自动驾驶多模态大语言模型玩出花了
2023-10-24 12:00:44
HiLM-D引入了一种新的方法,使用多模态大语言模型(MLLMs)来统一多个驾驶任务,称为风险目标定位和自车意图以及建议预测(ROLISP)。进一步提出了HiLM-D,以生成丰富的高分辨率特征图。...
首个多视角自动驾驶场景视频生成世界模型 | DrivingDiffusion: BEV数据和仿真新思路
2023-10-23 12:01:30
而对仿真来说,可以直接通过布局进行满足上述条件的视频生成,无疑是最直接的multi-agent传感器输入的构造方式。而DrivingDiffusion则从一个新的角度解决了上述问题。...
Exciting!GPT-4V在自动驾驶中初探
2023-10-19 12:01:08
解决一些所谓和效率相关的corner case应该是绰绰有余,但是想完全依赖大模型去独立完成驾驶保证安全性仍然十分遥远。...
自动驾驶端到端规划方案调研(工业界+学术界)
2023-10-18 12:01:33
本文以端到端规划为出发点,调研了一些近两年的业界新方案,其中也包含了一些连带感知和规划一起端到端自动驾驶的方案。...
自动驾驶数据不用愁!港中文等发布MagicDrive:日夜、雨晴、多视角全覆盖,人、物位置随意变更
2023-10-17 18:01:58
总的来说,MagicDrive带给我们一个全新的、高效的数据生成途径。不仅成功解决了之街景生成中的3D几何控制问题,而且提供了一种全新的方法,利用细粒度可控生成技术为3D自动驾驶产生训练数据,生成数据的质量和真实性向自动驾驶的感知技术注入了新的活力。...
自动驾驶仿真大观!一起聊聊自动驾驶仿真这个行当!
2023-10-17 12:01:24
究竟什么样的仿真场景才是有价值的呢?路测车辆采集的自然驾驶数据还原场景被认为是最能接近真实路况且随机性强的,但我们不是说目前路测花费的时间长赶不上趟儿吗?这就需要我们对路测数据进行处理,将交通参与者识别提取出来后再重新排列组合,形成基于真实数据的随机场景。...
“大大震惊”一位CTO:GPT-4V自动驾驶五连测
2023-10-16 12:00:56
GPT-4V的到来,给AI又带来了无限可能。近日,图森中国CTO王乃岩在知乎发表的《GPT-4V在自动驾驶中初探》引发了不少关注。在多项测试之后,他本人表示“大大震惊了我们”。那么具体效果如何?我们一同来看下。...