实践课一：PyTorch入门 | RLChina 强化学习社区

RLChina 2022-08-18 19:00:58 回复

seclee 2022-08-15 15:06:51

老师，想请教一下，转换 tensor 和 array 的时候，深浅拷贝不同的转换方法，使用中是不是需要考虑内存的占用？写代码的时候这种怎么考虑？

感谢这位同学的提问，恭喜获赠书籍！RLChina 强化学习社区后续会送出，请在 9 月 15 日前发送您的社区昵称、注册邮箱、姓名、电话和寄送地址至官方邮箱 rlchinacamp@163.com

RLChina 2022-08-18 19:00:33 回复

Williams 2022-08-15 08:46:54

老师您好，想问下在入门pytorch框架之后，RL实战有推荐的入门比赛或github仓库吗？谢谢老师😃

感谢这位同学的提问，恭喜获赠书籍！RLChina 强化学习社区后续会送出，请在 9 月 15 日前发送您的社区昵称、注册邮箱、姓名、电话和寄送地址至官方邮箱 rlchinacamp@163.com

RLChina 2022-08-18 18:58:45 回复

haijun 2022-08-15 14:43:02

老师您好，基于 pytorch 的强化学习框架比较多，他们在 pytorch 进一步封装，能达到几条命令完成算法，但是总感觉对算法的细节没有办法掌握。
请问在实际应用中，强化学习框架和基于算法原理自写代码，我们应该偏向于哪种方案？

感谢这位同学的提问，恭喜获赠书籍！RLChina 强化学习社区后续会送出，请在 9 月 15 日前发送您的社区昵称、注册邮箱、姓名、电话和寄送地址至官方邮箱 rlchinacamp@163.com

小

小龙虎 2022-08-17 21:05:52 回复

note: This error originates from a subprocess, and is likely not a problem with pip.
ERROR: Failed building wheel for hanabi-learning-environment
老师，我在下需求文件里的基本环境时出现了这个问题，该怎么解决

宋研 2022-08-16 08:19:44 回复

Jasmine 2022-08-15 17:40:29

我下载到本地以后再在 anaconda prompt 里面进入到我下载的目录里，然后再 create env 么？

可以 pip install . 这样就可以直接 import 了

宋研 2022-08-16 08:19:08 回复

llc 2022-08-15 23:47:33

上课的一些代码跑起来还是有点问题，主要是数据和模型在 GPU 和 CPU 上的转换

可以先考虑只在 CPU 上跑

llc 2022-08-15 23:47:33 回复

上课的一些代码跑起来还是有点问题，主要是数据和模型在 GPU 和 CPU 上的转换

seclee 2022-08-15 22:39:28 回复

自动化所王梓薏 2022-08-15 22:17:45

感谢这位同学的提问，恭喜获赠书籍！RLChina 强化学习社区后续会送出，请发送您的姓名电话和寄送地址至官方邮箱 rlchinacamp@163.com

感谢

自动化所王梓薏 2022-08-15 22:17:45 回复

seclee 2022-08-15 15:06:51

老师，想请教一下，转换 tensor 和 array 的时候，深浅拷贝不同的转换方法，使用中是不是需要考虑内存的占用？写代码的时候这种怎么考虑？

感谢这位同学的提问，恭喜获赠书籍！RLChina 强化学习社区后续会送出，请发送您的姓名电话和寄送地址至官方邮箱 rlchinacamp@163.com

自动化所王梓薏 2022-08-15 22:17:20 回复

Williams 2022-08-15 08:46:54

老师您好，想问下在入门pytorch框架之后，RL实战有推荐的入门比赛或github仓库吗？谢谢老师😃

感谢这位同学的提问，恭喜获赠书籍！RLChina 强化学习社区后续会送出，请发送您的姓名电话和寄送地址至官方邮箱 rlchinacamp@163.com

自动化所王梓薏 2022-08-15 22:16:48 回复

haijun 2022-08-15 14:43:02

老师您好，基于 pytorch 的强化学习框架比较多，他们在 pytorch 进一步封装，能达到几条命令完成算法，但是总感觉对算法的细节没有办法掌握。
请问在实际应用中，强化学习框架和基于算法原理自写代码，我们应该偏向于哪种方案？

感谢这位同学的提问，恭喜获赠书籍！RLChina 强化学习社区后续会送出，请发送您的姓名电话和寄送地址至官方邮箱 rlchinacamp@163.com

RLChina 2022-08-15 19:00:48 回复

喝果汁不上火 2022-08-15 17:46:51

老师请问哪里查看和 random 的比较结果

及第金榜那里可以查看提交的排名哈，你在个人中心也能查看

喝果汁不上火 2022-08-15 17:46:51 回复

老师请问哪里查看和 random 的比较结果

YanSong 2022-08-15 17:44:14 回复

宋研 2022-08-15 13:43:08

PyTorch 课程的课件和代码在这 👉 RLChina SummerCourse 2022

Behaviour Cloning data: Link

Jasmine 2022-08-15 17:40:29 回复

我下载到本地以后再在 anaconda prompt 里面进入到我下载的目录里，然后再 create env 么？

AINova 2022-08-15 17:32:02 回复

这算是两个智能体博弈吗老师

A

amiqiu 2022-08-15 17:27:40 回复

z请问老师讲课的PPT资料在哪里可以下载到？

C

clown 2022-08-15 17:17:11 回复

老师，作业是专家学习的范畴嘛，还想问下 LSTM 可以直接取代 RNN 嘛

I

ironartisan 2022-08-15 17:05:38 回复

老师，一般要怎么选择 loss 函数和优化器？有何建议？

llc 2022-08-15 16:56:03 回复

神经网络是对损失函数进行优化，强化学习也是类似用梯度下降吗？是否还有不同的优化方法或优化器？

小姚 2022-08-15 16:53:05 回复

Q QQisQQ 2022-08-15 16:17:21

用 Windows 环境可以做作业吗？

可以，我就是用的 windows

鱼

鱼饼战神 2022-08-15 16:30:08 回复

老师，在小规模数据集的前提下，使用不同 batch-size 训练神经网络表现性能的极限，是否就是逼近于直接将整个数据集作为输入回归得出的效果

G

Guan 2022-08-15 16:23:12 回复

实操才能进步

北

北柯 2022-08-15 16:22:51 回复

数组在维度上的运算很容易搞混，老师有什么好的记忆方法吗

小

小龙虎 2022-08-15 16:19:34 回复

老师，如果每次输入 batch size 的时候不把梯度清 0 的话，那与一般的增大 batch size 相比，有什么缺点呢，还是说两者是一个东西。

Jasmine 2022-08-15 16:19:33 回复

等下请老师讲下今天作业的环境配置安装流程吧？下载 clone 以后一直出错，对不上流程。

M

mcvoay 2022-08-15 16:19:13 回复

对于小白还是好劝退

5

555123 2022-08-15 16:18:24 回复

老师，请问训练时出现"nan"，训练时神经网络的输出都在 0-1 之间，参数也没有明显的问题，这种情况该怎么定位问题？

Q

QQisQQ 2022-08-15 16:17:21 回复

用 Windows 环境可以做作业吗？

happy魇 2022-08-15 16:10:24 回复

n_worker 设置大于 1 之后，在 cuda 上训练会有莫名的报错，老师有遇到过吗？类似于进程冲突

S

sakura 2022-08-15 15:41:40 回复

老师请问怎么在实际训练中，碰到损失爆炸情况，怎么定位训练过程中梯度哪里出现了问题呢？有什么比较好的解决方式吗

R

rogerlv51 2022-08-15 15:40:40 回复

冲冲冲

seclee 2022-08-15 15:28:06 回复

E Elwen 2022-08-15 15:11:54

std 函数是什么呢

标准差

E

Elwen 2022-08-15 15:11:54 回复

std 函数是什么呢

seclee 2022-08-15 15:06:51 回复

老师，想请教一下，转换 tensor 和 array 的时候，深浅拷贝不同的转换方法，使用中是不是需要考虑内存的占用？写代码的时候这种怎么考虑？

B

babiiElaine 2022-08-15 15:03:50 回复

笔记本电脑，没有 GPU，是否可以运行强化学习代码

San 2022-08-15 14:51:43 回复

感谢知识传授~

haijun 2022-08-15 14:43:02 回复

老师您好，基于 pytorch 的强化学习框架比较多，他们在 pytorch 进一步封装，能达到几条命令完成算法，但是总感觉对算法的细节没有办法掌握。
请问在实际应用中，强化学习框架和基于算法原理自写代码，我们应该偏向于哪种方案？

无

无你想你 2022-08-15 14:42:54 回复

老师，想问下一下 pytorch 和 tensorflow 两个之间的差别，选择哪一个会比较好？

L

lynn 2022-08-15 14:41:59 回复

有没有好的方法可以在 colab 永久装包？

小姚 2022-08-15 14:38:42 回复

老师，您好，想问一下强化学习有哪些调参技巧？谢谢老师！

时

时比业 2022-08-15 14:34:15 回复

老师，只用您的环境就行吧。

三

三千繁华 2022-08-15 14:32:32 回复

最近想入门，想听这门课程。这个学习帮助我入门，并想做出点成绩。

YanSong 2022-08-15 14:16:38 回复

宋研 2022-08-15 13:43:08

PyTorch 课程的课件和代码在这 👉 RLChina SummerCourse 2022

若 GitHub 打不开，可以在这里找到： Gitee

或者直接在 Colab 上实践：
Pytorch_intro: Colab

Pytorch_advanced: Colab

KRHKK 2022-08-15 14:05:17 回复

下载的 GitHub 代码 torch 版本 cuda 版本经常不匹配，改完 torch 版本经常运行不了，要改很多地方的代码，怎么改比较快？

2

200w 2022-08-15 14:04:14 回复

感觉很难自己从零写一个 RL 算法，往往是从 GitHub 下载别人的再修改，您觉得有必要训练自己从零写起吗？有必要的话有哪些推荐学习路径，不需要的话有哪些推荐仓库呢？

宋研 2022-08-15 13:43:08 回复

PyTorch 课程的课件和代码在这 👉 RLChina SummerCourse 2022

Williams 2022-08-15 08:46:54 回复

老师您好，想问下在入门pytorch框架之后，RL实战有推荐的入门比赛或github仓库吗？谢谢老师😃

AINova 2022-08-15 08:38:47 回复

温故而知新

vinbo 2022-08-11 19:07:10 回复

连语言都安排一次课有点意外了