【講座題目】對電力市場負荷服務實體的聯(lián)合投標與定價的深度強化學習
【講座時間】2019年12月16日(星期一)上午10:30
【講座地點】保定校區(qū) 教一樓 217
【主 講 人】Hongbo Sun,美國三菱電機研究所高級首席研究科學家
【主講人簡介】
Hongbo Sun,在重慶大學獲得電氣工程博士學位,現(xiàn)任美國三菱電機研究所高級首席研究科學家,在加入三菱電機研究所之前,他曾先后擔任過重慶大學的全職教授、Oracle 的首席應用工程師、SPL 的技術(shù)架構(gòu)師。他參與編著了一本書籍專著,并發(fā)表 110 余篇論文,并獲得 25 項專利。他的研究方向包括電力系統(tǒng)的運行和控制、電力系統(tǒng)的規(guī)劃和分析、智能電網(wǎng)的應用。
【內(nèi)容簡介】
在本次報告中,主講人將對負荷服務實體聯(lián)合在電力批發(fā)市場進行能源投標和在零售電力市場能源定價的問題進行講解。聯(lián)合投標和定價問題被構(gòu)建為具有連續(xù)狀態(tài)和行為空間的馬爾可夫決策過程,其中,能源投標和能源定價是兩個具有共同目標的行為。應用深度確定性策略梯度算法來求解此馬爾可夫決策過程,以獲取最佳的投標和定價策略。然而,深度確定性策略梯度算法通常需要大量的狀態(tài)轉(zhuǎn)換樣本,導致很高的計算成本。為此,應用神經(jīng)網(wǎng)絡從歷史數(shù)據(jù)中學習動態(tài)報價和價格響應函數(shù),去分別構(gòu)建電力批發(fā)市場和終端用戶集體行為的模型。這些響應函數(shù)可準確捕獲批發(fā)電力市場出清結(jié)果與終端用戶的響應之間的時間相關(guān)性,并可用于生成狀態(tài)轉(zhuǎn)換樣本,而無需任何計算成本。更重要的是,響應函數(shù)還為馬爾科夫決策過程中的狀態(tài)選擇提供了信息。本報告還通過一個算例將說明所提出方法的有效性。