当前位置:首页 > 百科生活 > 正文

【算法挑战赛】公共巴士辅助无线充电的电动汽车调度

(点击播放视频) 电动汽车的广泛应用不仅可以减少碳排放,还可以降低汽车对传统石油资源的依赖。然而,电动汽车的广泛应用面临着诸多挑战性问题:(1)为了解决电动汽车的充电问题,需要在城市内投入大量资金和土地资源建设大规模的充电站或充电桩;(2)电动汽车用户总是希望在截止时间之前到达目的地,不愿花费大量时间前往充电站给电动汽车充电;(3)大规模电动汽车采用传统充电方案(充电站、充电桩等)的充电行为,容易导致城市电网的不稳定。 为了解决上述问题,急需设计一种低成本、低时延和高效的新型充电系统。幸运的是,在大多数城市,公共巴士网络高度发达,可以覆盖人们绝大多数的日常生活轨迹。因此,电动汽车的大部分行驶轨迹可以被公共巴士网络覆盖。在公共巴士和电动汽车上集成在线电动汽车 (OnLine Electric Vehicle)OLEV系统和微波电力传输(Microwave Power Transfer)MPT系统,公共巴士作为移动充电站给电动汽车补能[1]。如图1所示,无线充电系统包含2辆电动汽车和1辆公共巴士。每辆电动汽车有指定起点和终点。公共巴士有固定的时刻表,通过OLEV系统充电。在相同路段上,当电动汽车主动靠近公共巴士时,电动汽车由公共巴士通过MPT系统充电。例如,当EV1行驶在路段a1、EV2行驶在路段a2时,可以从公共巴士上获取能量补给。 图1 公共巴士网络辅助无线充电的电动汽车调度场景 在上述无线充电系统中,路段分为两种类型:(1)普通路段,即电动汽车消耗能量;(2)充电路段,即在该路段电动汽车可以从公共巴士获得能量补给。电动汽车的调度面临以下问题:电动汽车调度必须满足截止时间约束(在截止时间之前达到终点)和能量约束(电动汽车在行驶过程中剩余电量总是非负的);充电路段的选择将极大地影响电动汽车的能耗和行驶时间。 1. 任务描述 本次比赛要求参赛选手以公共巴士辅助的电动汽车无线充电系统为核心,基于人工智能算法设计电动汽车调度方案,基于指定数据集设计仿真实验,验证所设计算法的性能。 2. 任务说明 假设充电路段总是有公共巴士在行驶,即电动汽车总是可以在充电路段获得能量补给。电动汽车和公共巴士在同一路段的行驶速度相同,且不考虑拥堵等因素,总是以恒定速度行驶。该任务输入交通网络数据和电动汽车参数,目的是为每辆电动汽车分配一条从指定起点到指定终点、满足能量约束和截止时间约束的路径且路径上的每个点只经过一次,使得所有到达终点的电动汽车剩余电量总和最大。 输入:交通网络数据和电动汽车参数,详见“三、数据集”(1),(2)和(3)。 输出:每辆电动汽车的分配路径及其到达终点的剩余电量,以及所有电动汽车到达指定终点的剩余电量总和。 赛题使用“纽约市公共巴士数据”的纽约市布鲁克林的公共巴士线路真实数据。该数据集来自纽约市MTA公共巴士数据流服务,包括MTA SIRI实时数据和MTA GTFS时间表数据记录。该数据集在大约10分钟的增量中,展示公共巴士位置、路线、公共巴士站台等信息,还包括公共巴士时刻表中的预定到达时间,以指示公共巴士的预定位置等。该数据集包含6461753行、19列数据。主办方从该数据集中随机抽取公共巴士站点数据,构造一个交通网络,提供以下数据集: (1)三个矩阵,分别表示任意两点之间的距离(单位km)、行驶速度(单位km/h)、是否可以充电(1表示可以充电,0表示不可以)。 (2)所有电动汽车的起点和终点的点集合:为每辆电动汽车从交通网络的顶点集合中随机选取起点和终点。 (3)其它参数从指定区间随机生成,具体设置如表1所示。 表 1 实验参数设置 参数 值 参数 值 顶点数 [40,100] 行驶速度 [10, 60]km/h 电动汽车数量 [30,100] 电动汽车初始电量 [10, 50]kWh MPT充电功率 100kW 电动汽车电池容量 [40, 100]kWh 电动汽车行驶能耗 [10,30] kWh/100km 电动汽车截止时间 正态分布 说明:(1)、(2)和(3)以 csv 文件形式提供。 (报名成功后,通知公告中获取数据集链接及提取码) 考虑基于深度强化学习[2][3],例如Deep Q Network,Deep Deterministic Policy Gradient (DDPG),Asynchronous Advantage Actor-Critic (A3C)等,设计电动汽车调度方案。 1.数据指标评价方式: 参赛队伍提交所有到达终点的电动汽车的剩余电量总和(单位:Kwh)。赛题成绩是参赛队伍提交的剩余电量总和ℰ与数据集中所有电动汽车的电池容量总和ℳ的比乘以100,即 如遇成绩相同情况,综合考虑运行时间、提交时间和算法创新性(特别关注AI算法的创新表现)等进行评定。源代码无法运行或无法正确输出赛题要求相关结果文件者,均视为无效提交。 2.总决赛综合评价方式参考大赛组委会评审总则。 参赛队伍提交一个以“参赛队伍名称+提交日期(YYYYMMDD)”命名的文件压缩包(需为.7z格式)(例如:江南大师队20240906.7z, 起队名的时候,中间不要有“.”符号,比如“江南.大师队” ),包含1个PDF文件和2个文件夹,具体要求如下: 1、“环境配置与模型定义”PDF文件:包含python版本、神经网络框架(TensorFlow或Pytorch)版本与环境所需软件包等信息;给出马尔可夫决策过程(Markov Decision Process, MDP)定义详情;列出深度强化学习(Deep Reinforcement Learning, DRL)相关参数(主办方提供word模板文件,完成内容后,另存为PDF文件)。 2、“源代码”文件夹:包含所有必要的源代码文件,请保存好训练好的模型参数,确保举办方能够独立运行并复现参赛队伍的算法结果。为了便于复现实验,开发环境建议使用Pycharm,请编写一个run.py文件,启动算法,加载训练好的模型参数,直接输出最终结果。 3、“输出结果”文件夹,包含如下文件: (1)results.xlsx文件:包括汇总和电动汽车调度细节等工作表。 “汇总”工作表的列字段分别是电动汽车序号、到达终点的剩余电量、到达终点的剩余截止时间(请注意:最后一行记录所有电动汽车剩余电量总和);“调度详情”工作表的第1行记录电动汽车初始化信息(电动汽车序号、起点序号、终点序号、初始电量、电池容量、截止时间);第2行记录0号电动汽车调度路径;第3行记录0号电动汽车走完每条路段的剩余电量和剩余截止时间,依此类推。 (2)rewards.csv:记录每辆电动汽车的每次训练(幕)的累计奖励,即当前训练(幕)每个动作的奖励总和。 (3)episode_rewards.jpg:基于rewards.csv文件生成的平均奖励数据图,即从rewards.csv第2列开始,每一列的均值。 (4)traing_cost.jpg:DRL的cost数据图。 主办方提供上述文件的模板和样例。 [1] Jin Y, Xu J, Wu S, Xu L, Yang D. Enabling the Wireless Charging via Bus Network: Route Scheduling for Electric Vehicles[J]. IEEE Transactions on Intelligent Transportation Systems, 2021, 22(3):1827-1839. [2] Z Wan, H Li, H He, D Prokhorov. Model-Free Real-Time EV Charging Scheduling Based on Deep Reinforcement Learning[J]. IEEE Transactions on Smart Grid, 2019, 10(5): 5246-5257. [3] H Li, Z Wan, H He. Constrained EV Charging Scheduling Based on Safe Deep Reinforcement Learning[J]. IEEE Transactions on Smart Grid, 2020, 11(3): 2427-2439. 1.获奖比例与大赛组委会公布的获奖比例一致; 2.省赛榜单截止时间:10月28日16:00,具体事宜另行通知。 1.获奖比例与大赛组委会公布的获奖比例一致; 2.省赛结束后另行通知。 (一)赛题负责人 联系人:靳勇 赛题QQ群:825627598 (二)国赛组委会 国赛组委会邮箱:lican@digix.org.cn 参赛学生交流QQ1群:695491030(此群已满) 参赛学生交流QQ2群:635906376(此群已满) 参赛学生交流QQ3群:178801349 大赛官网:www.digix.org.cn 赛氪网技术支持:温老师,电话&微信:17643826168;QQ:1095691517