(通讯员 郭凤安)近日,我校我院2018级电子信息工程专业本科生张知尧在人工智能Top期刊、国际自动控制联合会(IFAC)会刊《人工智能工程应用》(Engineering Applications of Artificial Intelligence) (影响因子IF=7.802)发表研究成果《融合领域知识与强化学习的家庭综合需求响应在线优化》(Fusing Domain Knowledge and Reinforcement Learning for Home Integrated Demand Response Online Optimization)。我校为论文第一单位,张知尧为第一作者,指导老师为苏永新副教授、谭貌教授。
深度强化学习在复杂环境中展现出卓越的优化性能与自适应系统不确定性的泛化能力,是支撑AlphaGO、ChatGPT学习进化的核心技术,具有广泛的应用前景。然而,学习效率低、难以支撑在线优化是长期困扰深度强化学习工业应用的问题。针对该问题,本文提出了领域知识与强化学习融合的新方法,并将该方法应用于家庭综合能源系统。在不增加计算资源的条件下,提出的方法较AlphaGo所采用的标准DQN算法训练速度提升2倍,满足了系统在线优化的严苛时限要求,同时具备自动适应环境变化的能力。
该研究为张知尧在我校本科学习期间完成,得到了国家重点研发计划项目、国家自然科学基金项目支持。张知尧大一进入谭貌教授、苏永新副教授团队开展创新实验,2022年本科毕业后被推荐至美国范德堡大学(Vanderbilt University,U.S. News美国最佳大学排名第13位)全奖直博,从事智能交通与节能方面的研究。谭貌教授牵头组建的智能电网与人工智能研究团队近年来围绕人工智能、强化学习及复杂能源系统建模优化开展研究,在IEEE Transactions on Power Systems, Applied Energy, Journal of Cleaner Production等中科院Top期刊发表系列论文。
论文链接:https://doi.org/10.1016/j.engappai.2023.105995