RLChina
RLChina 是由国内外强化学习学者联合发起的民间学术组织,主要活动包括举办强化学习线上公开课、强化学习线上研讨会等,旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。
发布于

前沿进展六:Distributed AI Scalability, Efficiency, and Generalizability

评论(10)
  • 孙罗洋 中科院自动化研究所
    S Sxc2021 2022-08-25 11:31:03

    请问在 market trading 问题中如何对环境进行建模,市场是动态变化的,如何保证通过历史数据训练的算法可以跟随市场变化?

    感谢这位同学的提问,恭喜获赠书籍!RLChina 强化学习社区后续会送出,请在 9 月 15 日前发送您的社区昵称、注册邮箱、姓名、电话和寄送地址至官方邮箱 rlchinacamp@163.com

  • 孙罗洋 中科院自动化研究所
    z z 2022-08-25 11:32:51
    请问老师,强化学习可以做股票预测么,这和RNN预测股票有何区别?

    感谢这位同学的提问,恭喜获赠书籍!RLChina 强化学习社区后续会送出,请在 9 月 15 日前发送您的社区昵称、注册邮箱、姓名、电话和寄送地址至官方邮箱 rlchinacamp@163.com

  • 孙罗洋 中科院自动化研究所
    Rewrite Rewrite 2022-08-25 11:35:08

    安老师您好,请问通过 local encoding 计算 global encoding 有什么好的方法吗,您提到的大规模动作表征是离散还是连续的,如果是连续的有什么好的表征方法吗?

    感谢这位同学的提问,恭喜获赠书籍!RLChina 强化学习社区后续会送出,请在 9 月 15 日前发送您的社区昵称、注册邮箱、姓名、电话和寄送地址至官方邮箱 rlchinacamp@163.com

  • Rewrite
    Rewrite 回复

    安老师您好,请问通过 local encoding 计算 global encoding 有什么好的方法吗,您提到的大规模动作表征是离散还是连续的,如果是连续的有什么好的表征方法吗?

  • Synx#254 回复

    老师您好,请问将模仿学习框架或离线强化学习用于处理 NLP 中的翻译问题可行吗,两者在应用上有哪些差别呢?

  • z
    z 回复
    请问老师,强化学习可以做股票预测么,这和RNN预测股票有何区别?
  • Sxc2021 回复

    请问在 market trading 问题中如何对环境进行建模,市场是动态变化的,如何保证通过历史数据训练的算法可以跟随市场变化?

  • vinbo
    vinbo 回复

    请问 deepmind 之前炒股亏损了 40 多亿,失败背后的技术原因是什么呢?

  • 10086 回复

    老师提到现在强化学习主要的研究突破都是单智能体,多智能体也局限于数量较少的问题上,请问老师多智能体数目增加带来的主要的困难是理论方面缺陷还是算力导致的局限性。谢谢老师

  • vinbo
    vinbo 回复

    请问安老师,NSGZero 算法的收敛性有理论保证吗?谢谢