- 发布于2024-04-22 15:56:15
通用决策模型路在何方?
有同学在研究决策通用模型吗?不知道这个发现会向那个方向发展。目前的一些思路比如传统的 meta-RL、domain adaption for RL、decision transformer 类的工作如 Gato、VLM 策略如 RT 系列,还有通用环境模型...赞 2评论 3浏览 459 - 发布于2024-04-07 17:05:17赞评论 2浏览 440
- 发布于2024-03-24 12:58:40
圆桌论道 | ICLR 2024 强化学习和 LLM 相关573篇论文整理
圆桌论道 “圆桌论道”是 RLChina 的一个栏目,发布国内外前沿学术活动的预告、总结或解读等。 导读 国际学习表征会议(International Conference on Learning Representations, 简称 ICLR)是计算机...赞 12评论 2浏览 6690 - 发布于2023-09-04 11:52:57
【兼职】专业不限,只要你本专业知识扎实即可胜任!
【介绍】 我们是一家专注于为大学生群体提供课后习题答疑的教育机构,采用网络 1 对 1 的答疑形式。在这里,我们能提供不同难度的习题辅导的机会。只要您有电脑,学习成绩优秀,在空闲时解题,然后用文字 or 文档的形式给学生答疑解惑即可。 【时间】 我们是灵活...赞 1评论 2浏览 514 - 发布于2021-10-09 19:29:14
推荐强化学习绘图库rl-plotter
非常实用的强化学习绘图库,一行命令就能搞定强化学习算法的学习曲线,详见 Github 页面 更新了预览图片,欢迎大家点赞本贴和 star 支持~ rl-plotter This is a simple tool which can plot lear...赞 24评论 21浏览 4063 - 发布于2022-12-29 14:14:15
【量化交易公司招聘】招聘强化学习方向实习生
#正定私募招实习生 🙌 量化研究-强化学习方向 工作内容 研究 RL 在量化交易中的应用 要求 1.国内外重点院校硕博生,至少实习 3 个月 2.有较为丰富的 RL 经验 3.掌握 Python,熟练使用各种机器学习工具 4.数学/机器学习知识扎实 ,有顶...赞 2评论 5浏览 1446 - 发布于2023-06-28 23:44:12
IJCAI 2023 4篇 RL4Finance 论文整理
本人在整理 IJCAI 2023 RL 相关论文 时,发现基于 RL 研究 economics、finance 问题的工作(竟然!)有 4 篇(而总体 RL 相关论文只有 66 篇),个人最近在研究计算经济学相关问题,因此自己学习的同时,将这 4 篇论文摘...赞 6评论 4浏览 1629 - 上海数字大脑研究院 上海数字大脑研究院(简称“数研院”)汇聚决策智能领域全球领先的科研力量,面向中国及全球产业智能化升级需求,致力于为全球企业提供决策智能解决方案,驱动各产业全面智能化升级。立志做中国产业进步的价值创新者,让决策更科学、更高效、更智能。发布于2023-03-16 15:51:21
ChatGPT和大模型春季课程Day4:港中文(深圳)助理教授王本友和北大助理教授杨耀东讲大语言模型的不同应用
RLChina 联合上海数字大脑研究院共同主办【ChatGPT 和大模型春季课程】。本次课程邀请全球人工智能领域知名专家和学者深入讲解 ChatGPT 和大模型的原理与实践。课程为期一周,分为专题报告、实践课和话题讨论三个部分。 今天【ChatGPT 和大...赞评论 5浏览 972 - 发布于2021-10-30 16:38:27赞 2评论 1浏览 1160
- 博文视点Broadview 博文视点,IT出版旗舰品牌,关注人工智能领域前沿技术与深度应用,出版人工智能领域优质好书。就跟小编一起来交流和学习人工智能的热点、难点知识吧!让我们一起来抢占人工智能至高点!发布于2021-12-07 09:23:04
解经典强化学习算法,搞定“阿尔法狗”下围棋
以上内容摘自《深度强化学习:基础、研究与应用》一书。想继续阅读的读者欢迎关注和购买此书阅读。 《深度强化学习:基础、研究与应用》 董豪、丁子涵、仉尚航等 著 一本书轻松上手深度学习 | 强化学习 | 模仿学习 | 集成学习 | 并行计算 | 多智能体强化...赞评论浏览 1030 - 发布于2022-02-11 23:00:32
圆桌论道 | AAAI 2022 强化学习相关 138 篇论文分类整理
圆桌论道 “圆桌论道”是 RLChina 的一个栏目,发布国内外前沿学术活动的预告、总结或解读等。 导读 AAAI (Association for the Advance of Artificial Intelligence) 是由国际人工智能促进协会主...赞 13评论 1浏览 5635