近日,在由毫末智行与清华大学智能产业研究院(AIR)联合举办的自动驾驶精品公开课中,清华AIR助理研究员/助理教授詹仙园博士从决策优化视角下解释了端到端自动驾驶AI算法的特点和当前进展。他着重指出,数据智能是整个自动驾驶迭代的核心。
詹仙园博士首先解释了端到端自动驾驶AI算法的含义,并指出这种算法是将所有架构和不同模块融合成一个完整的整体,直接从输入到输出进行训练,学习信号从决策处向前传递。端到端模型可以将所有模块组合在一起,形成一个超大模型,所有的目标都围绕着决策的最终目的进行优化和学习。
据了解,詹仙园博士同时详细介绍了端到端驾驶模型可以看成一个大型决策模型,需要使用决策优化的算法进行训练。这涉及到模仿学习和强化学习两种方法。模仿学习是通过监督学习的方法直接从数据中训练出映射;强化学习则不是简单的模仿数据,它通过不断学习优化找到一个比现有数据更好的决策模式。
在结束演讲时,詹仙园博士强调,数据智能在自动驾驶迭代中扮演着至关重要的角色。通过使用端到端算法和决策优化算法,我们可以更好地利用海量数据,提高自动驾驶的安全性和泛化性。
本文采编:CY