v**i 发帖数: 50 | 1 大家都知道在动态规划中,有一个压缩映射定理,说的是从一个动态规划问题,可以写
出Functional equation (FE),FE 右端可以构造一个算子,可以证明这个算子是有界函
数空间上的压缩映射,有一个唯一的不动点,然后这个不动点还是动态规划问题的
Value function. 同样的问题,转化成连续时间模型下,为什么这些性质都不见了呢?
虽然有一个HJB微分方程对应于FE,但是一般不太容易证明这个方程解唯一。现有的我
见过的唯一性证明,都是假设动态规划问题的state space是有界的,而且这些证明都
假设解要满足外加的边界条件,除此之外还要满足相当奇怪的附加条件(对不起,因为
没有什么直观含义,我都忘了是什么条件,但我可以提供reference),为什么是这样呢
?为什么离散时模型的性质在连续时中这么难证明?我有点担心是我没找到对路的书,
所以请教一下高手.. | g*****u 发帖数: 14294 | 2 动态规划核心是所谓的最优性原理。不太理解你所采用的视角。有没有参考课本或文献
? |
|