标签
神经网络优化器训练稳定性AI 顶会边界问题优化rl_zoo3stablebaseline3重要性采样大语言模型中稿论文ICMLinverseRLofflineRLRL清华大学交叉信息研究院具身智能开放式学习生成模型特征选择Decision-MakingAISafetyLLM税收计算经济SMAC大模型智能体工业界落地比赛自动出价neuripsMean-Filed量化ICML2023智能机械数字孪生roboticsSim2real多智能体合作多智能体协作因果推断RL4FinanceIJCAI2023演化强化学习基于模型的强化学习约束强化安全强化RLHF博士后招聘决策大模型德扑AIAIGA大模型;Chat GPT产业落地良师益友工程师论文整理2023ICLRTransformerChatGPT机器人tensorboard强化深度学习Transformer序列模型四足机器人safetyRLconstrained数据智能WIM人工智能,量化交易强化学习招聘获奖甲子光年复现Gato多模态决策大模型36kr新经济之王谷歌足球足球AI终极人工智能机器意识技术沙龙On-policyOpenAI大规模预训练模型预训练模型#强化学习#上海科技大学#RLChina 论文研讨会多模态学习请教羊了个羊AI竞赛校招秋招序列检测RNNDeepLearning游戏AI高效示教模仿学习大模型安全群体强化学习通用人工智能DeepMind运筹优化leader-follower类与方法混合动作空间NeuralMMONerualMMOMLOps#强化学习#汽车标定#汽车#强化学习#工业控制#白皮书广告出价高校合作可编程强化学习PyTorch模型表现差损失收敛DQN春招FootballCoG2022CoGBaselinesSafe-RL清华大学中山大学前言追踪RLChina汇总圆桌论道量子计算AAAI2022#前沿追踪新闻动态学术活动图神经网络神经网络联邦学习计算机视觉图像搜索离线强化学习#多智能体强化学习#GNN 模型图深度学习球球大作战决策智能#联合培养#访问学生自然语言BERT人工智能RLChina 论文研讨会论文分类NeurIPS 2021机器学习推荐系统天池大赛国际跳棋西洋跳棋Checkers论文讨论会算法AI知识图谱meta-RL一文七问视频理解图像分类实习华为RLChina智能体挑战赛秋季赛辛丑年免费开源mujoco多智能体MARL多智能体强化学习前沿追踪CartPoleAC前沿讲习班讲习班自动驾驶FrozenLake的状态转移gym环境FrozenLake-v0gympython论文科研实用工具
公告

首次进入社区的小伙伴,欢迎了解以下事项,参与相关活动:

一、RLChina 组织形式:http://rlchina.org/topic/211

二、RLChina 2024 大会(可下载课件):http://rlchina.org/rlchina_2024

三、RLChina 2023 大会(可下载课件):http://rlchina.org/rlchina_2023

四、RLChina 2022 强化学习暑期课:http://rlchina.org/topic/491

五、RLChina 2021 强化学习暑期课:http://rlchina.org/topic/9?utm_source=pocket_saves

六、RLChina 智能体挑战赛:http://rlchina.org/topic/928

七、RLChina 前沿讲习班:http://rlchina.org/topic/215

八、RLChina 论文研讨会:http://rlchina.org/topic/219