用于自动驾驶的仿真环境的构建的方法和装置与流程-j9九游会真人

文档序号：35752956发布日期：2023-10-16 18:09阅读：来源：国知局

技术特征：
1.一种用于自动驾驶的仿真环境的构建的方法，包括：确定所述仿真环境中障碍对象的环境信息；随机确定所述障碍对象的行为模式；以及基于所述环境信息和随机确定的所述行为模式确定所述障碍对象的移动轨迹。2.如权利要求1所述的方法，其中，所述环境信息包括所述障碍对象对周围环境的感知信息。3.如权利要求2所述的方法，其中，所述障碍对象的周围环境包括基于自动驾驶模型进行驾驶的仿真目标车辆，所述环境信息包括所述障碍对象对所述仿真目标车辆的感知信息。4.如权利要求1所述的方法，其中，所述障碍对象包括行人、非机动车、机动车中的至少一项。5.如权利要求1所述的方法，其中，随机确定所述障碍对象的行为模式包括：从预定义的多个行为模式类别中随机地选取一项作为所述障碍对象的行为模式。6.如权利要求5所述的方法，其中，从预定义的多个行为模式类别中随机地选取一项作为所述障碍对象的行为模式包括：通过基于针对各个行为模式类别预定的采样概率从所述多个行为模式类别中进行采样来确定所述障碍对象的行为模式。7.如权利要求5所述的方法，其中，所述多个行为模式类别是人工标注的或对路测数据进行聚类而得到的。8.如权利要求1所述的方法，其中，基于所述环境信息和随机确定的所述行为模式确定所述障碍对象的移动轨迹包括：利用障碍物轨迹预测模型对所述环境信息和随机确定的所述行为模式进行处理，以得到所述障碍对象的移动轨迹。9.如权利要求8所述的方法，其中，所述障碍物轨迹预测模型是基于所述障碍对象的类别而确定的。10.如权利要求8所述的方法，其中，所述障碍物轨迹预测模型是通过以下方式得到的：确定由自动驾驶车辆在真实道路上采集的环境样本数据和对应于所述环境样本数据的真实轨迹；对所述环境样本数据进行分类，以得到所述环境样本数据对应的行为模式类别；利用障碍物轨迹预测模型的初始参数对所述环境样本数据和所述环境样本数据对应的行为模式类别进行处理，以得到针对所述环境样本数据的预测轨迹；以及基于所述真实轨迹和所述预测轨迹之间的差异调整所述障碍物轨迹预测模型的初始参数，以得到所述障碍物轨迹预测模型的更新参数。11.一种用于自动驾驶的仿真环境的构建的装置，包括：环境信息确定单元，被配置成确定所述仿真环境中障碍对象的环境信息；采样单元，被配置成随机确定所述障碍对象的行为模式；以及预测单元，被配置成基于所述环境信息和随机确定的所述行为模式确定所述障碍对象的移动轨迹。12.如权利要求11所述的装置，其中，所述环境信息包括所述障碍对象对周围环境的感
知信息。13.如权利要求12所述的装置，其中，所述障碍对象的周围环境包括基于自动驾驶模型进行驾驶的仿真目标车辆，所述环境信息包括所述障碍对象对所述仿真目标车辆的感知信息。14.如权利要求11所述的装置，其中，所述障碍对象包括行人、非机动车、机动车中的至少一项。15.如权利要求11所述的装置，其中，所述采样单元被配置成：从预定义的多个行为模式类别中随机地选取一项作为所述障碍对象的行为模式。16.如权利要求15所述的装置，其中，从预定义的多个行为模式类别中随机地选取一项作为所述障碍对象的行为模式包括：通过基于针对各个行为模式类别预定的采样概率从所述多个行为模式类别中进行采样来确定所述障碍对象的行为模式。17.如权利要求15所述的装置，其中，所述多个行为模式类别是人工标注的或对路测数据进行聚类而得到的。18.如权利要求11所述的装置，其中，所述预测单元被配置成：利用障碍物轨迹预测模型对所述环境信息和随机确定的所述行为模式进行处理，以得到所述障碍对象的移动轨迹。19.如权利要求18所述的装置，其中，所述障碍物轨迹预测模型是基于所述障碍对象的类别而确定的。20.如权利要求18所述的装置，其中，所述障碍物轨迹预测模型是通过以下方式得到的：确定由自动驾驶车辆在真实道路上采集的环境样本数据和对应于所述环境样本数据的真实轨迹；对所述环境样本数据进行分类，以得到所述环境样本数据对应的行为模式类别；利用障碍物轨迹预测模型的初始参数对所述环境样本数据和所述环境样本数据对应的行为模式类别进行处理，以得到针对所述环境样本数据的预测轨迹；以及基于所述真实轨迹和所述预测轨迹之间的差异调整所述障碍物轨迹预测模型的初始参数，以得到所述障碍物轨迹预测模型的更新参数。21.一种用于在仿真环境中对自动驾驶模型进行训练的方法，其中所述仿真环境是基于如权利要求1-10中任一项所述的方法构建的，所述方法包括：获取仿真输入信息，其中所述仿真输入信息包括部署有所述自动驾驶模型的仿真目标车辆在所述仿真环境中的感知信息；将所述仿真输入信息输入所述自动驾驶模型，以获取所述自动驾驶模型所输出的第一仿真自动驾驶策略信息；确定用于所述第一仿真自动驾驶策略信息的仿真评价反馈信息；基于所述仿真输入信息、所述第一仿真自动驾驶策略信息和所述仿真评价反馈信息，调整所述自动驾驶模型的参数。22.如权利要求21所述的方法，其中，所述仿真输入信息还包括仿真干预标识，所述仿真干预标识指示第一仿真自动驾驶策略信息是否为存在人为干预的自动驾驶策略信息，
基于所述仿真输入信息、所述第一仿真自动驾驶策略信息和所述仿真评价反馈信息，调整所述自动驾驶模型的参数包括：基于所述仿真干预标识、所述仿真输入信息、所述第一仿真自动驾驶策略信息和所述仿真评价反馈信息，调整所述自动驾驶模型的参数。23.如权利要求21或22所述的方法，其中，调整所述自动驾驶模型的参数包括基于强化学习的方式调整所述自动驾驶模型的参数。24.如权利要求21-23中任一项所述的方法，还包括：基于调整后的自动驾驶模型控制所述仿真目标车辆在所述仿真环境中执行自动驾驶；针对仿真环境中的障碍对象，获取所述障碍对象的仿真环境样本信息，其中所述仿真环境样本信息包括障碍对象对基于所述调整后的自动驾驶模型控制的所述仿真目标车辆的感知信息；利用障碍物轨迹预测模型对所述仿真环境样本信息进行处理，以得到针对所述仿真环境样本信息的仿真预测轨迹；确定用于所述仿真预测轨迹的评价反馈信息；以及基于所述仿真环境样本信息、所述仿真预测轨迹以及用于所述仿真预测轨迹的评价反馈信息更新所述障碍物轨迹预测模型的参数。25.一种用于在仿真环境中对自动驾驶模型进行训练的装置，其中所述仿真环境是基于如权利要求1-10中任一项所述的方法构建的，所述装置包括：获取单元，被配置成获取仿真输入信息，其中所述仿真输入信息包括部署有所述自动驾驶模型的仿真目标车辆在所述仿真环境中的感知信息；自动驾驶策略确定单元，被配置成将所述仿真输入信息输入所述自动驾驶模型，以获取所述自动驾驶模型所输出的第一仿真自动驾驶策略信息；评价反馈单元，被配置成确定用于所述第一仿真自动驾驶策略信息的仿真评价反馈信息；参数调整单元，被配置成基于所述仿真输入信息、所述第一仿真自动驾驶策略信息和所述仿真评价反馈信息，调整所述自动驾驶模型的参数。26.一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-10、21-25中任一项所述的方法。27.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-10、21-25中任一项所述的方法。28.一种计算机程序产品，包括计算机程序，其中，所述计算机程序在被处理器执行时实现权利要求1-10、21-25中任一项所述的方法。

技术总结
本公开提供了一种用于自动驾驶的仿真环境的构建的方法和装置，涉及计算机技术领域，尤其涉及自动驾驶技术领域。实现方案为：确定所述仿真环境中障碍对象的环境信息；随机确定所述障碍对象的行为模式；基于所述环境信息和随机确定的所述行为模式确定所述障碍对象的移动轨迹。利用本公开的实施例，可以为自动驾驶模型的训练提供与真实道路环境更相似的仿真环境，不但能够在自动驾驶模型训练初期利用仿真的高效迭代使得模型快速具备初步能力，还可以在自动驾驶模型被部署到真车上开始实车路测之后，依然利用仿真环境产生多样化的真实场景来继续训练模型，使得能够提高自动驾驶模型的训练效果。型的训练效果。型的训练效果。

技术研发人员：黄际洲王凡叶晓青卓安
受保护的技术使用者：北京百度网讯科技有限公司
技术研发日：2023.03.17
技术公布日：2023/10/15

完整全部详细技术资料下载

当前第2页1 2