RLChina RLChina 是由国内外强化学习学者联合发起的民间学术组织，主要活动包括举办强化学习线上公开课、强化学习线上研讨会等，旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。

发布于 2022-08-09 12:59:52

前沿进展一：强化学习在动态宏观经济学中的应用前景

课程学习

浏览 (1770) 点赞 (1) 收藏

朱老师 2022-08-25 12:02:25 回复

 vinbo 2022-08-24 23:01:19

我的设想是，能不能把外部因素也建一个从经济学角度的简化模型出来，一起跟原来的模型合成一个扩展模型，如果能做到显然更理想。然而似乎并不容易。朱老师怎么看这种思路？

这就看计算机速度有多快了，足够快的话，可以把政治、经济、战争都在模型里面内生化。现在好像已经有全球经济活动日常模拟了。
vinbo 2022-08-24 23:01:19 回复

 朱老师 2022-08-24 17:47:48

社会科学就是这样，需要很多假设，只能是尽可能跟各个因素的专业研究领域里面的人聊，看看把什么样的参数赋给马氏过程比较靠谱。

我的设想是，能不能把外部因素也建一个从经济学角度的简化模型出来，一起跟原来的模型合成一个扩展模型，如果能做到显然更理想。然而似乎并不容易。朱老师怎么看这种思路？
朱老师 2022-08-24 17:47:48 回复

 vinbo 2022-08-24 12:13:38

可是这么做我感觉太粗了啊，比方我提到的几个方面，作为随机因素的分布要怎么假设？

社会科学就是这样，需要很多假设，只能是尽可能跟各个因素的专业研究领域里面的人聊，看看把什么样的参数赋给马氏过程比较靠谱。
朱老师 2022-08-24 12:57:06 回复

时时比业 2022-08-24 11:32:38

老师，用 Double DQN 求解 optimal execution 时，对冲风险，算奖励还是环境？谢谢

能不能描述更清楚一些？这是个编程的某一步吧？
闫雪 2022-08-24 12:36:04 回复

奔奔跑 2022-08-24 10:05:18

老师您好，最优控制的fixed point 与博弈论的NS point 有哪些不同？

@奔跑感谢这位同学的提问，恭喜获赠书籍！RLChina 强化学习社区后续会送出，请在 9 月 15 日前发送您的社区昵称、注册邮箱、姓名、电话和寄送地址至官方邮箱 rlchinacamp@163.com
闫雪 2022-08-24 12:35:47 回复

时时比业 2022-08-24 09:48:26

老师，Krusell-Smith 模型，应用多智能体解决连续问题，有优势吗？谢谢

@时比业感谢这位同学的提问，恭喜获赠书籍！RLChina 强化学习社区后续会送出，请在 9 月 15 日前发送您的社区昵称、注册邮箱、姓名、电话和寄送地址至官方邮箱 rlchinacamp@163.com
闫雪 2022-08-24 12:35:21 回复

 HalfLarry 2022-08-24 09:46:18

向朱老师提问：朱老师，您会不会觉得多智能体技术和经济学的融合会在区块链等完全数字化的环境会有更深度的落地应用？

@HalfLarry 感谢这位同学的提问，恭喜获赠书籍！RLChina 强化学习社区后续会送出，请在 9 月 15 日前发送您的社区昵称、注册邮箱、姓名、电话和寄送地址至官方邮箱 rlchinacamp@163.com
vinbo 2022-08-24 12:13:38 回复

 朱老师 2022-08-24 10:47:52

把不能在模型内生决定的因素都用一个外生假设的随机过程表述，放到环境里面去

可是这么做我感觉太粗了啊，比方我提到的几个方面，作为随机因素的分布要怎么假设？
时

时比业 2022-08-24 11:32:38 回复

老师，用 Double DQN 求解 optimal execution 时，对冲风险，算奖励还是环境？谢谢
朱老师 2022-08-24 10:56:52 回复

 qazcy1983 2022-08-24 10:15:59

老师好！请问一下，在您展望的部分的第一个问题“optimal control in infinite dimension", 如有用 deep learning 方法能给出一种解决方案，这样的工作具有创新性吗？大概能投哪种类型的期刊呢？

无穷维分析在货币政策里面有应用，但是目前不是用 nn 来解的
朱老师 2022-08-24 10:54:27 回复

时时比业 2022-08-24 10:17:23

老师，连续模型（continuous-time）可以用 DDPG 求解吗？谢谢

可以。Actor-Critic 在动态宏观里面已经有应用
朱老师 2022-08-24 10:49:50 回复

 qazcy1983 2022-08-24 10:20:56

老师您好！如您所说的平台双边匹配问题等价于多智能体 mean-field 博弈问题，双边匹配这个方向目前的研究价值大吗？有相关的工作吗？

有市场应用前景，之前的研究静态的居多
朱老师 2022-08-24 10:48:58 回复

L Larry 2022-08-24 10:21:02

朱教授您好，想问下强化学习与经济学相关的书籍都有哪些？宏观和微观中是不是都有所涉及？

现在还没有看到书，都是在各个社区里面讨论和看论文为主
朱老师 2022-08-24 10:47:52 回复

 vinbo 2022-08-24 10:21:54

请问宏观经济往往受政治、国际形势、甚至疫情的影响，那么建模和用 RL 解的时候怎么把这些因素考虑进来呢？谢谢

把不能在模型内生决定的因素都用一个外生假设的随机过程表述，放到环境里面去
朱老师 2022-08-24 10:46:35 回复

G googol 2022-08-24 10:26:40

老师，请问rl在经济学领域的应用是否会考虑鲁棒性，公平性等相关的问题？

会考虑 Robust control
G

googol 2022-08-24 10:26:40 回复

老师，请问rl在经济学领域的应用是否会考虑鲁棒性，公平性等相关的问题？
J

jlcheng2035 2022-08-24 10:26:18 回复

老师好，强化学习在预测单只股票价格上有相关应用吗？
vinbo 2022-08-24 10:21:54 回复

请问宏观经济往往受政治、国际形势、甚至疫情的影响，那么建模和用 RL 解的时候怎么把这些因素考虑进来呢？谢谢
L

Larry 2022-08-24 10:21:02 回复

朱教授您好，想问下强化学习与经济学相关的书籍都有哪些？宏观和微观中是不是都有所涉及？
qazcy1983 2022-08-24 10:20:56 回复

老师您好！如您所说的平台双边匹配问题等价于多智能体 mean-field 博弈问题，双边匹配这个方向目前的研究价值大吗？有相关的工作吗？
时

时比业 2022-08-24 10:17:23 回复

老师，连续模型（continuous-time）可以用 DDPG 求解吗？谢谢
qazcy1983 2022-08-24 10:15:59 回复

老师好！请问一下，在您展望的部分的第一个问题“optimal control in infinite dimension", 如有用 deep learning 方法能给出一种解决方案，这样的工作具有创新性吗？大概能投哪种类型的期刊呢？
奔

奔跑 2022-08-24 10:07:20 回复

请问老师，强化学习与经济学结合的应用前景怎么样，现在有哪些研究方向，感谢老师！
奔

奔跑 2022-08-24 10:05:18 回复

老师您好，最优控制的fixed point 与博弈论的NS point 有哪些不同？
时

时比业 2022-08-24 09:48:26 回复

老师，Krusell-Smith 模型，应用多智能体解决连续问题，有优势吗？谢谢
HalfLarry 2022-08-24 09:46:18 回复

向朱老师提问：朱老师，您会不会觉得多智能体技术和经济学的融合会在区块链等完全数字化的环境会有更深度的落地应用？