AG百家乐大转轮-AG百家乐导航_怎么看百家乐走势_全讯网官网 (中国)·官方网站

科研新聞

首頁 > 科研新聞 > 正文

研究提出基于靈敏度信息的CVaR動態優化理論與算法

稿件來源:管理學院 編輯:孫琛、王冬梅 審核:孫耀斌 發布日期:2023-11-21 閱讀量:

中大新聞網訊(通訊員夏俐)近期,中山大學管理學院夏俐教授在管理學領域國際高水平期刊Production and Operations Management(簡稱POM)上發表了題為“Risk-Sensitive Markov Decision Processes with Long-Run CVaR Criterion”的研究論文,論文的其他作者還包括中山大學管理學院的博士生張璐瑤和斯坦福大學管理科學與工程系的Peter W. Glynn 教授。該研究針對隨機動態系統中的過程中損失的CVaR優化問題進行研究,完善了相應的優化理論及算法體系。

CVaR指標是重要的風險刻畫指標,在應用于多階段動態決策時,由于指標函數的不可加性導致經典動態規劃原理失效,Bellman最優性方程不成立,需要尋求新的優化方法。本文基于靈敏度優化方法對離散時間無窮階段穩態CVaR 準則下的馬氏決策過程(MDP)優化問題進行研究。通過引入偽 CVaR 指標,將原問題轉化為一個兩層MDP問題,內層為標準動態規劃問題,外層為偽CVaR的單參數優化問題,并給出了 CVaR性能差分公式用以刻畫不同策略對應的穩態 CVaR 性能差。

論文證明了確定性平穩策略的最優性,基于CVaR差分公式和性能導數公式得到了CVaR Bellman局部最優方程,從而給出了得到局部最優策略的充要條件以及穩態CVaR MDP的策略迭代型算法,證明了該算法可收斂至局部最優策略。進一步,論文基于兩層MDP問題的靈敏度信息和臨界點分析,證明了偽CVaR函數的分片線性、分段凸的性質,在此基礎上給出了一種全局最優算法,證明了算法可收斂至全局最優策略。論文最后通過多個數值實驗對比驗證了本文優化理論與算法的有效性。

論文的主要貢獻可分為以下三點,第一,本文首次對衡量系統過程波動性的穩態CVaR準則下的MDP優化理論進行研究,完善了現有文獻在該類指標的理論體系;第二,不同于經典MDP理論,本文從靈敏度優化的角度對穩態CVaR MDP進行研究,得到了CVaR 性能差分公式、性能導數公式以及 CVaR Bellman 局部最優方程;第三,通過將原問題轉化為兩層MDP問題,本文首次提出了MDP的CVaR指標的有效求解算法,分別得到了一種可快速收斂至局部最優的策略迭代型算法以及一種基于靈敏度分析的全局最優算法,填補了現有MDP文獻關于CVaR的有效求解算法的空白。

論文鏈接:https://doi.org/10.1111/poms.14077


中大新聞
新聞投稿
叶氏百家乐官网平注技巧| 罗平县| 玩百家乐凤凰娱乐城| 百家乐投注五揽式| 必胜娱乐场| 大发888娱乐场下载删除 | 足球投注技巧| 叶氏百家乐平注技巧| 山阳县| 恒丰百家乐官网的玩法技巧和规则| 财神百家乐的玩法技巧和规则 | 临朐县| 法拉利百家乐的玩法技巧和规则| 澳门百家乐官网打缆| 垫江县| 百家乐官网制胜法| 钱大发888游戏下载| 利都百家乐官网国际赌场娱乐网规则| 大发888真人斗地主| 网上百家乐官网正规代理| 优博百家乐官网的玩法技巧和规则 | 大发888下载专区| 香港百家乐官网六合彩| 百家乐小游戏单机版| 将乐县| 百家乐打庄技巧| 京城国际| 百家乐路单| 现金百家乐官网人气最高| 百家乐庄家必赢诀窍| 百家乐官网投注方法投资法| 百家乐博娱乐场开户注册| 武隆县| 威尼斯人娱乐城澳门威| 百家乐官网公式书| 大发888娱乐城加速器| A8百家乐官网赌场娱乐网规则 | 大杀器百家乐学院| 缅甸百家乐官网的玩法技巧和规则| 壹贰博网站| 百家乐投注网站是多少|