...高斯—马尔可夫随机过程建模,动态负荷分配不足可理解为一个离散时间马尔可夫决策过程(Discrete Time Markov Decision Processes, DTMDP).从而将强化学习理论中基于随机最优制约技术的Q-学习策略引入CPS指令优化分配对策的研究。
基于4个网页-相关网页
时间马尔可夫决策过程
Temporal Markov decision process
以上为机器翻译结果,长、整句建议使用 人工翻译 。
应用推荐
模块上移
模块下移
不移动