RLChina
RLChina 是由国内外强化学习学者联合发起的民间学术组织,主要活动包括举办强化学习线上公开课、强化学习线上研讨会等,旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。
发布于

金榜题名 | RLChina 智能体挑战赛 - 癸卯年夏赛季等你来战!

评论(2)
  • Tic 回复

    在执行订单的时候,发现系统分配到的订单 agent['orders_to_pick'] 会存在曼哈顿距离大于 5 的订单,与题目描述不符。
    在抢订单的时候,agent 可见的新订单中,也包括了曼哈顿距离大于 5 的订单。

  • Tic 回复

    action_space 中的第四组动作是什么含义?

    从规则说明上看,action space 有 3 组动作,分别是移动(5 元组)、被分配订单的选取(20 元组)和持有的订单是否放下(5 元组)。但是代码里存在第四组动作,是一个 10 元组(run_log.py:179)

    这个 10 元组是什么含义?