职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
1、负责强化学习(Reinforcement Learning, RL)算法的研发与优化,探索其在智能决策、机器人控制、游戏AI、广告推荐等场景的应用;
2、结合业务需求,设计并实现高效、可扩展的强化学习算法,包括但不限于DQN、PPO、SAC、Multi-Agent RL、Meta RL等;
3、参与大规模分布式强化学习系统的开发,解决模型训练、部署中的性能与稳定性问题;
4、与产品、数据团队紧密协作,推动算法在真实场景中的落地与迭代;
截止日期:2026年03月18日
招聘人数:2人
工作地点
地址:北京朝阳区北京-朝阳区望京科技园E座


职位发布者
赵晋HR
北京招招才科技有限公司

-
计算机软件
-
100-199人
-
私营·民营企业
-
北京市朝阳区来广营街道望京诚盈中心1号楼12层1204
相似职位
-
直播内容运营 8000-13000元天河区 应届毕业生 大专网易(杭州)网络有限公司
-
测试高级工程师(a83538) 15000-20000元天河区 应届毕业生 本科广州小鹏汽车科技有限公司
-
集成测试高级工程师(a214556) 15000-30000元天河区 应届毕业生 本科广州小鹏汽车科技有限公司
-
后端开发工程师(南京) 面议增城区 应届毕业生 不限海澜集团有限公司
-
智能智驾类-自动驾驶测试资深工程师/专家 (mj015704) 25000-40000元番禺区 应届毕业生 不限广州小鹏汽车科技有限公司
-
web前端开发工程师 面议番禺区 应届毕业生 不限广州赛泽科技有限公司