强化学习方向硕士生寻找 北美/欧洲/新西兰/澳大利亚地区 导师
各位老师好: 本人于2023年6月毕业于天津师范大学,取得计算机科学与技术硕士学位。2015年本科毕业于武汉大学信息安全专业。 我的主要研究兴趣是强化学习。早在读硕士之前就立志于此方向,也非常希望在未来的博士阶段继续在强化学习方向上进行研究研究。有关强化学习的一切我都很感兴趣,硕士阶段关于强化学习主要关注的问题有以下几个方面: - 内部奖励机制以及GVFs - 如何解决agent在不同任务中切换进行训练时的遗忘效应 - 如何创造一种可以生长的,基于深度神经网络的人工智能agent - 多智能体强化学习以及Transformer在强化学习中的应用 我的研究生阶段大部分精力都是放在强化学习上的。但是由于实验室条件一般(50多学生排队使用两台显卡服务器,一台4张1080,一台两张2080),并且没有导师或者同学和我一样对强化学习感兴趣,只能自己一个人探索。所以我的进度比较缓慢,亮眼的成果不多。但是早期尝试过的一些构想,后来已经有人结合Transformer给做了(model-based method with Transformer)。还为一位同学发表的关于使用强化学习方法进行重要特征选择的论文提供过强化学习方面的理论支持(合著)。 我的另一个研究方向是模型压缩-剪支,是受导师引领所开始的研究。产出为一篇打破SOTA记录的论文。限于实验条件,最初的投稿由于缺少大模型和大数据集(ImageNet)方面的试验而被拒稿。目前正在持续的改稿和补充试验。预印版已发布在arXiv上(https://arxiv.org/abs/2310.06344)。 硕士阶段我一共发表过5篇论文,其中两篇为第一作者。一篇的研究内容是CNN结构化剪支,另一篇是增强上下文特征的图片分类。其余三篇是硕士阶段比较早期参与的工作。一篇为使用强化学习方法进行重要特征选择,我主要提供强化学习理论方面的帮助,另两篇主要帮助跑实验。 **技能:** - python编程(熟练) - Pytorch与Tensorflow编程(熟练),环境配置熟练,可以从0开始搭建网络结构,熟悉神经网络训练的各项环节。跑实验项目经验丰富。(在实验室负责指导新人入门,代码答疑,帮助同学跑实验调bug) - Linux操作系统及GPU服务器的运维。可以从硬件开始独立完成GPU服务器的搭建。管理经验丰富。 - 熟练使用Latex编辑器等科研常用套件 在研究生阶段我的学业成绩排名专业第2(共计53名学生)。两次获得奖学金。我的托福成绩为95分(R25, L29, S20, W21)。 **其它有用信息:** - 本科学业结束后曾在一家游戏公司担任游戏策划。主要职能是使用LUA语言搭建游戏世界脚本(怪物AI,NPC AI,活动副本等)。负责创造游戏内容,搭建游戏世界架构,规则设计,设计流程,协调各部门(程序,美术等)保证项目进度。也负责玩家群体心理分析,制定项目计划,指定市场营销策略等。这段时间也恰好是AlphaGo一炮走红的时候,感到自己当初从事的所谓AI设计,是多么渺小低级,同时也彻底着迷于真正的AI,并将强化学习作为自己的研究方向。遂决定辞职考研。我认为这段时间的经历对于从事强化学习方面的研究是十分有帮助的,我擅长于理解游戏规则,能够迅速抓住很多本质元素。 - 我是一名Knowledge-based system期刊的学生审稿人,比较热衷于审稿这项工作。 - 我负责帮助我的导师以及实验室其他老师,带新手入门,从理论和实践两方面提供指导和帮助。人缘还不错。 **个人特点:** 对于AI科学,我的热情是毋庸置疑的,我认为对于AI的探索几乎就等同于对我们人类自身的探索,比如思考方式,目的和意义等。我擅长结合其它领域的知识,比如心理学,生物学,哲学等方面,来思考关于AI的研究。尽管现阶段我的很多idea看上去可能比较野,不切实际,或者比较模糊,但是我很少有缺乏灵感停止思考的时候。我热衷于学术聊天,喜欢主动找人探讨问题。我时刻关注AI领域内的热点问题,对于很多突破性的研究,例如GAN,Transformer,ku扩散模型,我都是第一个把他们引入我们的实验室的。不像很多中国学生那样,我很少在社交场合胆怯,相反,我很乐于主动在一些交流会上发表自己的观点,例如,去一些公司或者机构寻求合作的场合。我也能够有意识的培养团队风气,帮助建立和谐轻松的实验室氛围,我是学院“强化学习桌游俱乐部”的创办者,研究生三年,这个俱乐部带给了我们很多欢乐,并且有效地拉近同学们之间的距离。 *学术之外:* 艺术上,我的特长是长笛演奏,曾在武汉大学交响乐团担任三年长笛首席兼木管声部长,并举办过个人演奏音乐会(如果有机会从事AI于音乐的研究项目,我可能有非常大的帮助)。运动上,我喜欢打羽毛球,在业余选手中也还不错。我也喜欢滑冰滑雪,折纸,做饭,以及有关科幻的一切。对于任何博士阶段可能遇到的困难,我都有勇气去面对。 我想我的履历可能不算突出。真诚希望可以找到一位导师乐意将我收入麾下。我大概算不上千里马,但是跑的也还挺快。 寻求一位 北美/欧洲/新西兰/澳大利亚地区 强化学习方向的导师。最想去的是美国或加拿大地区,其它地方也很乐意。研究方向也不是特别死板,我对人工智能的很多方向都很感兴趣,例如模型压缩,神经网络的可解释性,生成式模型,人机交互,LLM,机器人等等。或者一些专注于与某个领域相结合的应用研究,医疗,自动驾驶,音乐,天文,农业机器人等等。我认为任何一个方向的研究都是有趣且有价值的,并且这些领域的很多根本问题都是类似或同质的。 毕业后打算进入公司的研发部门,或从事高等教学研究工作。 我需要奖学金和生活费方面的资助。家境一般,而且家里不太乐意资助我出国读博。目前没有打算花太多的时间在勤工俭学上。校园工作,如助教,除外。还是希望能更加专注一些的做研究。 期待并欢迎任何老师联系我,或者将我推荐给其它苦于招不到学生的AI领域博士生导师。期待遇到科研路上的明灯和同伴。 (拒绝留学中介) 联系方式: 邮箱:dukewbj@163.com 微信(中国国内版,非Wechat): wbojue 祝各位老师们工作顺利! 致礼
各位老师好:
本人于2023年6月毕业于天津师范大学,取得计算机科学与技术硕士学位。2015年本科毕业于武汉大学信息安全专业。
我的主要研究兴趣是强化学习。早在读硕士之前就立志于此方向,也非常希望在未来的博士阶段继续在强化学习方向上进行研究研究。有关强化学习的一切我都很感兴趣,硕士阶段关于强化学习主要关注的问题有以下几个方面:
- 内部奖励机制以及GVFs
- 如何解决agent在不同任务中切换进行训练时的遗忘效应
- 如何创造一种可以生长的,基于深度神经网络的人工智能agent
- 多智能体强化学习以及Transformer在强化学习中的应用
我的研究生阶段大部分精力都是放在强化学习上的。但是由于实验室条件一般(50多学生排队使用两台显卡服务器,一台4张1080,一台两张2080),并且没有导师或者同学和我一样对强化学习感兴趣,只能自己一个人探索。所以我的进度比较缓慢,亮眼的成果不多。但是早期尝试过的一些构想,后来已经有人结合Transformer给做了(model-based method with Transformer)。还为一位同学发表的关于使用强化学习方法进行重要特征选择的论文提供过强化学习方面的理论支持(合著)。
我的另一个研究方向是模型压缩-剪支,是受导师引领所开始的研究。产出为一篇打破SOTA记录的论文。限于实验条件,最初的投稿由于缺少大模型和大数据集(ImageNet)方面的试验而被拒稿。目前正在持续的改稿和补充试验。预印版已发布在arXiv上(https://arxiv.org/abs/2310.06344)。
硕士阶段我一共发表过5篇论文,其中两篇为第一作者。一篇的研究内容是CNN结构化剪支,另一篇是增强上下文特征的图片分类。其余三篇是硕士阶段比较早期参与的工作。一篇为使用强化学习方法进行重要特征选择,我主要提供强化学习理论方面的帮助,另两篇主要帮助跑实验。
技能:
- python编程(熟练)
- Pytorch与Tensorflow编程(熟练),环境配置熟练,可以从0开始搭建网络结构,熟悉神经网络训练的各项环节。跑实验项目经验丰富。(在实验室负责指导新人入门,代码答疑,帮助同学跑实验调bug)
- Linux操作系统及GPU服务器的运维。可以从硬件开始独立完成GPU服务器的搭建。管理经验丰富。
- 熟练使用Latex编辑器等科研常用套件
在研究生阶段我的学业成绩排名专业第2(共计53名学生)。两次获得奖学金。我的托福成绩为95分(R25, L29, S20, W21)。
其它有用信息:
- 本科学业结束后曾在一家游戏公司担任游戏策划。主要职能是使用LUA语言搭建游戏世界脚本(怪物AI,NPC AI,活动副本等)。负责创造游戏内容,搭建游戏世界架构,规则设计,设计流程,协调各部门(程序,美术等)保证项目进度。也负责玩家群体心理分析,制定项目计划,指定市场营销策略等。这段时间也恰好是AlphaGo一炮走红的时候,感到自己当初从事的所谓AI设计,是多么渺小低级,同时也彻底着迷于真正的AI,并将强化学习作为自己的研究方向。遂决定辞职考研。我认为这段时间的经历对于从事强化学习方面的研究是十分有帮助的,我擅长于理解游戏规则,能够迅速抓住很多本质元素。
- 我是一名Knowledge-based system期刊的学生审稿人,比较热衷于审稿这项工作。
- 我负责帮助我的导师以及实验室其他老师,带新手入门,从理论和实践两方面提供指导和帮助。人缘还不错。
个人特点:
对于AI科学,我的热情是毋庸置疑的,我认为对于AI的探索几乎就等同于对我们人类自身的探索,比如思考方式,目的和意义等。我擅长结合其它领域的知识,比如心理学,生物学,哲学等方面,来思考关于AI的研究。尽管现阶段我的很多idea看上去可能比较野,不切实际,或者比较模糊,但是我很少有缺乏灵感停止思考的时候。我热衷于学术聊天,喜欢主动找人探讨问题。我时刻关注AI领域内的热点问题,对于很多突破性的研究,例如GAN,Transformer,ku扩散模型,我都是第一个把他们引入我们的实验室的。不像很多中国学生那样,我很少在社交场合胆怯,相反,我很乐于主动在一些交流会上发表自己的观点,例如,去一些公司或者机构寻求合作的场合。我也能够有意识的培养团队风气,帮助建立和谐轻松的实验室氛围,我是学院“强化学习桌游俱乐部”的创办者,研究生三年,这个俱乐部带给了我们很多欢乐,并且有效地拉近同学们之间的距离。
学术之外:
艺术上,我的特长是长笛演奏,曾在武汉大学交响乐团担任三年长笛首席兼木管声部长,并举办过个人演奏音乐会(如果有机会从事AI于音乐的研究项目,我可能有非常大的帮助)。运动上,我喜欢打羽毛球,在业余选手中也还不错。我也喜欢滑冰滑雪,折纸,做饭,以及有关科幻的一切。对于任何博士阶段可能遇到的困难,我都有勇气去面对。
我想我的履历可能不算突出。真诚希望可以找到一位导师乐意将我收入麾下。我大概算不上千里马,但是跑的也还挺快。
寻求一位 北美/欧洲/新西兰/澳大利亚地区 强化学习方向的导师。最想去的是美国或加拿大地区,其它地方也很乐意。研究方向也不是特别死板,我对人工智能的很多方向都很感兴趣,例如模型压缩,神经网络的可解释性,生成式模型,人机交互,LLM,机器人等等。或者一些专注于与某个领域相结合的应用研究,医疗,自动驾驶,音乐,天文,农业机器人等等。我认为任何一个方向的研究都是有趣且有价值的,并且这些领域的很多根本问题都是类似或同质的。
毕业后打算进入公司的研发部门,或从事高等教学研究工作。
我需要奖学金和生活费方面的资助。家境一般,而且家里不太乐意资助我出国读博。目前没有打算花太多的时间在勤工俭学上。校园工作,如助教,除外。还是希望能更加专注一些的做研究。
期待并欢迎任何老师联系我,或者将我推荐给其它苦于招不到学生的AI领域博士生导师。期待遇到科研路上的明灯和同伴。
(拒绝留学中介)
联系方式:
邮箱:dukewbj@163.com
微信(中国国内版,非Wechat): wbojue
祝各位老师们工作顺利!
致礼
各位老师好:
本人于2023年6月毕业于天津师范大学,取得计算机科学与技术硕士学位。2015年本科毕业于武汉大学信息安全专业。
我的主要研究兴趣是强化学习。早在读硕士之前就立志于此方向,也非常希望在未来的博士阶段继续在强化学习方向上进行研究研究。有关强化学习的一切我都很感兴趣,硕士阶段关于强化学习主要关注的问题有以下几个方面:
- 内部奖励机制以及GVFs
- 如何解决agent在不同任务中切换进行训练时的遗忘效应
- 如何创造一种可以生长的,基于深度神经网络的人工智能agent
- 多智能体强化学习以及Transformer在强化学习中的应用
我的研究生阶段大部分精力都是放在强化学习上的。但是由于实验室条件一般(50多学生排队使用两台显卡服务器,一台4张1080,一台两张2080),并且没有导师或者同学和我一样对强化学习感兴趣,只能自己一个人探索。所以我的进度比较缓慢,亮眼的成果不多。但是早期尝试过的一些构想,后来已经有人结合Transformer给做了(model-based method with Transformer)。还为一位同学发表的关于使用强化学习方法进行重要特征选择的论文提供过强化学习方面的理论支持(合著)。
我的另一个研究方向是模型压缩-剪支,是受导师引领所开始的研究。产出为一篇打破SOTA记录的论文。限于实验条件,最初的投稿由于缺少大模型和大数据集(ImageNet)方面的试验而被拒稿。目前正在持续的改稿和补充试验。预印版已发布在arXiv上(https://arxiv.org/abs/2310.06344)。
硕士阶段我一共发表过5篇论文,其中两篇为第一作者。一篇的研究内容是CNN结构化剪支,另一篇是增强上下文特征的图片分类。其余三篇是硕士阶段比较早期参与的工作。一篇为使用强化学习方法进行重要特征选择,我主要提供强化学习理论方面的帮助,另两篇主要帮助跑实验。
技能:
- python编程(熟练)
- Pytorch与Tensorflow编程(熟练),环境配置熟练,可以从0开始搭建网络结构,熟悉神经网络训练的各项环节。跑实验项目经验丰富。(在实验室负责指导新人入门,代码答疑,帮助同学跑实验调bug)
- Linux操作系统及GPU服务器的运维。可以从硬件开始独立完成GPU服务器的搭建。管理经验丰富。
- 熟练使用Latex编辑器等科研常用套件
在研究生阶段我的学业成绩排名专业第2(共计53名学生)。两次获得奖学金。我的托福成绩为95分(R25, L29, S20, W21)。
其它有用信息:
- 本科学业结束后曾在一家游戏公司担任游戏策划。主要职能是使用LUA语言搭建游戏世界脚本(怪物AI,NPC AI,活动副本等)。负责创造游戏内容,搭建游戏世界架构,规则设计,设计流程,协调各部门(程序,美术等)保证项目进度。也负责玩家群体心理分析,制定项目计划,指定市场营销策略等。这段时间也恰好是AlphaGo一炮走红的时候,感到自己当初从事的所谓AI设计,是多么渺小低级,同时也彻底着迷于真正的AI,并将强化学习作为自己的研究方向。遂决定辞职考研。我认为这段时间的经历对于从事强化学习方面的研究是十分有帮助的,我擅长于理解游戏规则,能够迅速抓住很多本质元素。
- 我是一名Knowledge-based system期刊的学生审稿人,比较热衷于审稿这项工作。
- 我负责帮助我的导师以及实验室其他老师,带新手入门,从理论和实践两方面提供指导和帮助。人缘还不错。
个人特点:
对于AI科学,我的热情是毋庸置疑的,我认为对于AI的探索几乎就等同于对我们人类自身的探索,比如思考方式,目的和意义等。我擅长结合其它领域的知识,比如心理学,生物学,哲学等方面,来思考关于AI的研究。尽管现阶段我的很多idea看上去可能比较野,不切实际,或者比较模糊,但是我很少有缺乏灵感停止思考的时候。我热衷于学术聊天,喜欢主动找人探讨问题。我时刻关注AI领域内的热点问题,对于很多突破性的研究,例如GAN,Transformer,ku扩散模型,我都是第一个把他们引入我们的实验室的。不像很多中国学生那样,我很少在社交场合胆怯,相反,我很乐于主动在一些交流会上发表自己的观点,例如,去一些公司或者机构寻求合作的场合。我也能够有意识的培养团队风气,帮助建立和谐轻松的实验室氛围,我是学院“强化学习桌游俱乐部”的创办者,研究生三年,这个俱乐部带给了我们很多欢乐,并且有效地拉近同学们之间的距离。
学术之外:
艺术上,我的特长是长笛演奏,曾在武汉大学交响乐团担任三年长笛首席兼木管声部长,并举办过个人演奏音乐会(如果有机会从事AI于音乐的研究项目,我可能有非常大的帮助)。运动上,我喜欢打羽毛球,在业余选手中也还不错。我也喜欢滑冰滑雪,折纸,做饭,以及有关科幻的一切。对于任何博士阶段可能遇到的困难,我都有勇气去面对。
我想我的履历可能不算突出。真诚希望可以找到一位导师乐意将我收入麾下。我大概算不上千里马,但是跑的也还挺快。
寻求一位 北美/欧洲/新西兰/澳大利亚地区 强化学习方向的导师。最想去的是美国或加拿大地区,其它地方也很乐意。研究方向也不是特别死板,我对人工智能的很多方向都很感兴趣,例如模型压缩,神经网络的可解释性,生成式模型,人机交互,LLM,机器人等等。或者一些专注于与某个领域相结合的应用研究,医疗,自动驾驶,音乐,天文,农业机器人等等。我认为任何一个方向的研究都是有趣且有价值的,并且这些领域的很多根本问题都是类似或同质的。
毕业后打算进入公司的研发部门,或从事高等教学研究工作。
我需要奖学金和生活费方面的资助。家境一般,而且家里不太乐意资助我出国读博。目前没有打算花太多的时间在勤工俭学上。校园工作,如助教,除外。还是希望能更加专注一些的做研究。
期待并欢迎任何老师联系我,或者将我推荐给其它苦于招不到学生的AI领域博士生导师。期待遇到科研路上的明灯和同伴。
(拒绝留学中介)
联系方式:
邮箱:dukewbj@163.com
微信(中国国内版,非Wechat): wbojue
祝各位老师们工作顺利!
致礼