开放数据会暴露自己的技术问题,Waymo为什么还要这么做

(图片来源:autonews)

自动驾驶已经成为不可逆转的发展趋势,但究竟何时会实现完全的自动驾驶还是一个未知数。机器要取代人类驾驶员,相关的技术发展需要大量的数据作为支撑,而数据的获得以及处理并不是那么容易的一件事,这需要花费大量的人力和物力。

在这一领域,像特斯拉一样的公司还在各自为政,也有一些公司正在敞开怀抱,开源成为新的动向。

8月22日,Waymo发布其第一套自动驾驶多模式传感器数据,研究人员可以在其网站上waymo.com/open免费获取这些数据。

其实今年6月,在全球最大的计算机视觉会议CVPR第一天的自动驾驶研讨会上,Waymo首席科学家兼研发负责人德拉戈·安圭洛夫(Drago Anguelov)就宣布公开包含完整传感器信息且带标注的驾驶数据。

此次公布的数据集,包含了3000段驾驶记录,平均每段长度约为20秒,时长共 16.7 小时。每秒钟大约有10帧数据,算下来整个数据集包含了60万帧。

Waymo没有食言。不同的是,这一次安圭洛夫在新闻发布会上表示,“高分辨率传感器数据”是为大学和其他私人研究公司的研究人员准备的。

该公司表示,数据集包括1000个驾驶片段的视频,这些视频来自不同的驾驶环境,且是360度视角。还包括激光雷达框架和图像,车辆、行人、骑行者和路牌都做了仔细的标记。

Waymo Open Dataset开放数据集可以帮助研究人员在二维和三维感知方面取得进展,并推动在领域适应性、场景理解和行为预测等方面的进步。

安圭洛夫说,Waymo的车辆已经在25个地点的公共道路上行驶了1000万英里,现在可以在网上获得的只是其过去10年收集数据中的“一小部分”。

“我们特意选择了多样化和代表性的数据说明我们所面临的研究问题。”而且全套数据“不会轻易让研究人员接触到......它需要行业级的基础设施来处理” 。

“我们的意图不是影响公众的看法,而是要为研究界做出贡献。” 当然,任何访问这些数据的人都必须遵守一项许可协议,要在数据公开和确保竞争对手不会在生产中使用这些信息之间“取得良好的平衡”。这家公司表示道。

尽管如此,我们也不可忽视Waymo希望能加快自动驾驶领域发展的愿景。

“这只是第一关。”安圭洛夫说,“我们希望公布该领域关键问题的基准,并围绕这些问题组织竞赛。从长远来看,我们将着眼于进一步扩展基于社区反馈的数据集。”

其实,Waymo并不是第一家开放数据的自动驾驶公司。就在上个月,Lyft开源L5级自动驾驶数据集,包括55000个人工标注的3D框架;由7个摄像头和3个激光雷达收集的数据;高清空间语义地图,包括车道和人行横道等等;以及可用于行驶的表面地图。该公司号称这是同类产品中最大的公开数据集。

除此之外,Lyft还表示很快会公布基于数据集的比赛,测试集和验证结果也会在比赛后公布。

该公司希望每家汽车制造商都能生产自动驾驶车辆,重点是采用Lyft的平台。

并没有兑现今年实现自动驾驶车辆商业化部署承诺的Cruise,在开源这件事上还是有所贡献的。7月,该公司宣布Webviz数据可视化工具可共享,自动驾驶从业者、研究人员、学生和工程师们都可以利用这一工具,将自动驾驶的技术数据,包括激光雷达、雷达以及摄像头等各种传感器捕捉的大量数据拖放到ROS bag文件中,更加直观地了解数据。

同样,Uber早在今年2月份开源了基于 web 的自动驾驶可视化系统AVS。AVS 可以显示自动驾驶汽车在真实世界场景中的性能,是一种描述自动驾驶汽车的感知、运动以及数据规划可视化的新标准。通过AVS 的抽象可视化功能,开发人员可以专注于驾驶系统、远程协助、地图绘制以及模拟等核心的自动驾驶研发。

此外,今年4月,安波福宣布全面开放自动驾驶汽车开源数据集nuScenes,并称其是第一家向公众开放此类安全数据的公司。nuScenes覆盖1000个场景,数据来自波士顿和新加坡各地,包括140万张图像、39万帧激光雷达扫描和140万个人工标注的3D物体框架。

该公司称,这些数据为研究人员和行业专家提供了精心收集管理的安全标准,极大地促进行业的巨大进步和创新。

更早前在去年3月,百度Apollo自动驾驶开放平台正式加入加州大学伯克利DeepDrive深度学习自动驾驶产业联盟,正式开放大规模自动驾驶数据集ApolloScape, 包括场景解析、细粒度车道线、定位、三维车辆拟合以及稠密轨迹五个公开数据集。

另外还有前面提到的伯克利等研究机构以及Argo AI的Argoverse数据集都不同程度的开放了。

研究人员利用这些数据取得的进展将使Waymo和整个行业受益。Waymo产品负责人维真赛·帕特奈克(Vijaysai Patnaik)在其新闻发布会上如此表示,“我们所有人都是研究团体中的一员。”他说,“我们理解收集这些数据有多难,他们不得不造一辆车,然后安装传感器并进行校准。”

虽然共享数据会暴露自动驾驶技术的问题,但用安圭洛夫的话来说,这个正处于发展中的领域的确需要“提出正确的问题”来指引方向。