您当前浏览器版本过低,为了不影响您的使用,建议您使用最新的谷歌浏览器、火狐浏览器、 360浏览器,更换浏览器后使用更流畅!(注意!双核浏览器请切换为极速模式)
400-607-9388
  • 赵冬斌
  • 所属院校: 中国科学院大学
  • 所属院系: 人工智能学院
  • 职称: 研究员
  • 导师类型: 博导
  • 招生专业:
  • 研究领域: 智能学习控制:深度强化学习,自适应动态规划,强化学习,演化计算,智能游戏,自动机器学习 智能交通:智能驾驶,交通信号控制,车路协同 机器人:移动机器人感知与学习控制,机电一体化系统
个人简介

个人简介

招生方向 深度强化学习,自适应动态规划,强化学习,智能控制 智能驾驶,智能游戏,机器人,智能交通,能源管控 神经架构搜索,自动机器学习 教育背景 1996-09--2000-04 哈尔滨工业大学 博士 1994-09--1996-07 哈尔滨工业大学 硕士 1990-09--1994-07 哈尔滨工业大学 学士 出国学习工作 2007年8月-2008年8月,University of Arizona, 访问学者,国家留学基金委公派留学计划。 工作简历 2014-01~2014-02,新加坡科技研究局, 访问学者 2012-11~现在, 中科院自动化所, 研究员、博导 2002-04~2012-10,中国科学院自动化研究所, 副研、硕导-博导 2000-05~2002-01,清华大学, 博士后 教授课程 强化学习 智能控制 智能控制理论基础及应用 奖励信息 (1) 2017年度IEEE Transactions on Cognitive and Developmental Systems优秀论文奖(唯一), , 其他, 2019 (2) IEEE Fellow, , 其他, 2019 (3) 《控制理论与应用》优秀编委, , 其他, 2019 (4) 中国人工智能学会优秀博士学位论文指导教师, , 部委级, 2019 (5) 2019年中国AI+创新创业大赛, 一等奖, 部委级, 2019 (6) IJCNN 2018 Best Student Paper Final List, 其他, 2018 (7) 《控制理论与应用》优秀论文奖, 其他, 2018 (8) 前方车辆距离监测第1名,2017年中国智能车未来挑战赛—复杂交通环境认知基础能力离线测试比赛, 一等奖, 国家级, 2017 (9) 前方车辆检测第1名,2017年中国智能车未来挑战赛—复杂交通环境认知基础能力离线测试比赛, 一等奖, 国家级, 2017 (10) 基于数据的非线性系统自学习最优控制理论与方法, 三等奖, 部委级, 2015 (11) 中国科学院“朱李月华优秀教师”奖, , 院级, 2014 (12) 中国石油和化工自动化应用协会科技进步一等奖, 一等奖, 部委级, 2012 (13) 北京市科学技术奖, 三等奖, 省级, 2010 (14) 中国石油和化学工业协会科技进步三等奖, 三等奖, 部委级, 2009 专利成果 ( 1 ) 极坐标方式自动水平调节吊具系统及方法, 发明, 2010, 第 1 作者, 专利号: ZL200710178782.8 ( 2 ) 转球式洗衣机及方法, 发明, 2010, 第 1 作者, 专利号: ZL200510011787.2 ( 3 ) 一种应用于互联网的网络拥塞控制系统及方法, 发明, 2010, 第 3 作者, 专利号: ZL 200610113821.1 ( 4 ) 火灾抢险机器人系统及其方法, 发明, 2010, 第 1 作者, 专利号: ZL200510126236.0 ( 5 ) 一种正交式水平自动调节吊具及方法, 发明, 2010, 第 3 作者, 专利号: ZL200710122474.3 ( 6 ) 火灾救援机器人系统及其方法, 发明, 2010, 第 1 作者, 专利号: ZL200510130759.2 ( 7 ) 街区路口交通信号优化控制方法, 发明, 2011, 第 1 作者, 专利号: ZL200910076851.3 ( 8 ) 单配重式自动水平调节吊具系统及方法, 发明, 2012, 第 1 作者, 专利号: ZL200810240941.7 ( 9 ) 车辆的自适应巡航控制系统和方法, 发明, 2013, 第 1 作者, 专利号: ZL201010615914.0 ( 10 ) 煤气化炉仿真方法, 发明, 2014, 第 1 作者, 专利号: ZL201210291386.7 ( 11 ) 模糊自适应动态规划方法, 发明, 2014, 第 1 作者, 专利号: ZL201210118982.5 ( 12 ) Adaptive Cruise Control System and Method for Vehicle, 发明, 2016, 第 1 作者, 专利号: PAT 9266533 ( 13 ) 基于监督式强化学习的最优控制方法, 发明, 2016, 第 1 作者, 专利号: ZL103324085A ( 14 ) 基于数据的Q函数自适应动态规划方法, 发明, 2016, 第 1 作者, 专利号: ZL103217899A ( 15 ) 一种基于稀疏强化学习的传感器网络优化方法, 发明, 2017, 第 1 作者, 专利号: ZL201310739109.2 ( 16 ) 储能电池充/放电异常行为检测方法及检测系统, 发明, 2019, 第 1 作者, 专利号: ZL201610687158.X 发表著作 (1) 全方位移动机器人导论, An introduction to Omnidirectinoal Mobile Robots, 科学出版社, 2010-05, 第 1 作者 (2) 机器人手册,第26章-面向操作任务的运动, Springer Handbook of Robotics, Chapter 26 - Motion for Manipulation Tasks, 机械工业出版社, 2013-01, 第 1 作者 (3) 机器人手册,第51章-智能车辆, Springer Handbook of Robotics, Chapter 51 - Intelligent Vehicles, 机械工业出版社, 2013-01, 第 1 作者 (4) Advances in Brain Inspired Cognitive Systems, Advances in Brain Inspired Cognitive Systems, Springer Heidelberg Dordrecht London NewYork, 2013-06, 第 3 作者 (5) Frontiers of Intelligent Control and Information Processing, Frontiers of Intelligent Control and Information Processing, World Scientific Publishing, 2014-11, 第 3 作者 (6) Advances in Neural Networks – ISNN 2015, Springer Heidelberg Dordrecht London NewYork, 2015-04, 第 4 作者 (7) Neural Information Processing, Lecture Notes in Computer Science 10636, 10637, 10638, 10639, Springer Heidelberg Dordrecht London NewYork, 2017-10, 第 4 作者 科研项目 ( 1 ) 基于数据的非线性控制系统分析与设计, 参与, 国家级, 2011-01--2014-12 ( 2 ) 汽车的智慧起停巡航控制, 主持, 省级, 2012-01--2014-12 ( 3 ) 基于监督式ADP 的汽车智能巡航控制, 主持, 国家级, 2013-01--2016-12 ( 4 ) 能源管控中心平行控制节能技术研究, 参与, 省级, 2013-04--2014-12 ( 5 ) 建筑能耗数据挖掘与分析工具包开发, 参与, 省级, 2013-12--2014-12 ( 6 ) 汽车自适应巡航控制(ACC)系统及方法, 主持, 省级, 2013-09--2016-05 ( 7 ) 人机交互的监督强化学习控制理论和方法, 主持, 研究所(学校), 2015-01--2016-12 ( 8 ) 深度自适应动态规划理论方法和应用, 主持, 国家级, 2016-01--2019-12 ( 9 ) 基于数据的建筑群及分布式能源系统一体化建模与自学习优化控制, 参与, 国家级, 2016-01--2020-12 ( 10 ) 中国科学院海外评审专家(何海波), 主持, 部委级, 2015-01--2016-12 ( 11 ) 智能辅助驾驶控制系统关键技术研究与产品开发, 主持, 国家级, 2016-07--2019-06 ( 12 ) 不完全信息动态博弈的优化决策, 主持, 国家级, 2017-03--2018-12 ( 13 ) 深度神经网络优化的群体协作神经动力学方法, 主持, 部委级, 2018-01--2020-12 ( 14 ) 智能驾驶危险目标检测的深度强化学习方法, 主持, 省级, 2018-01--2019-12 ( 15 ) 高度自动驾驶(L4级)电动汽车关键技术研发及验证平台开发--深度强化学习应用, 主持, 省级, 2018-01--2019-12 ( 16 ) “气虚证辨证标准的系统研究”的中医证候辨证新方法研究--中医AI, 主持, 国家级, 2018-01--2020-12 ( 17 ) 基于人工智能的智能驾驶体验科普展品, 主持, 省级, 2018-01--2018-12 ( 18 ) 强化学习技术和硬件化技术研究, 主持, 院级, 2018-09--2019-06 ( 19 ) 面向智能驾驶的深度强化学习方法研究, 主持, 院级, 2018-09--2019-08 ( 20 ) 面向地铁运营场景需求的智能感知核心技术研究, 主持, 院级, 2018-09--2019-08 ( 21 ) 非完全信息条件下的博弈决策--知识与数据共同驱动的深度强化学习算法, 主持, 国家级, 2020-01--2022-12 ( 22 ) 复杂城市交互场景下的电动汽车智能决策技术, 主持, 省级, 2019-07--2020-06 ( 23 ) 适配硬件的算子结构优化及自动并行切分技术研究, 主持, 院级, 2019-08--2020-05 参与会议 (1)Deep Reinforcement Learning for Video Game 华为多智能体强化学习研讨会 2019-04-25 (2)深度强化学习算法与医疗应用 中国中医药信息研究会临床研究分会第三届学术年会 2018-09-08 (3)深度强化学习算法与应用 中国自动化学会“深度与宽度强化学习”前沿论坛 2018-05-30 (4)Game AI with RL and DL 2018-05-21 (5)深度强化学习进展:从AlphaGo到AlphaGo Zero 第二届世界智能大会 2018-05-17 (6)Game AIs with RL and DL 2018-05-16 (7)Recent Progress on Deep Reinforcement Learning-- from AlphaGo to AlphaGo Zero 三星机器学习前沿研讨会 2018-01-15 (8)深度强化学习算法及应用 中国电力科学研究院2017年二 零八科学会议—人工智能在电力领域的研究应用方向和关键技术 2017-12-06 (9)Cooperative reinforcement learning for multiple units combat in StarCraft Kun Shao, Yuanheng Zhu, Dongbin Zhao 2017-11-28 (10)Event-triggered integral reinforcement learning for nonlinear continuous-time systems Qichao Zhang, Dongbin Zhao 2017-11-28 (11)深度强化学习进展—从AlphaGo到AlphaGo Zero 中国仿真学会智能物联专委会会议 2017-11-17 (12)Off-Policy reinforcement learning for partially unknown nonzero-sum games 2017-11-16 (13)FMR-GA -- A cooperative multi-agent reinformcement learning algorithm based on gradient ascent 2017-11-16 (14)人工智能方法及其在智慧城市中的应用 泰山科技论坛—人工智能在智慧城市建设中的应用研究 2017-11-08 (15)A Kolmogorov-Smirnov test to detect changes in stationarity in big data 2017-07-06 (16)Multi-task learning with Cartesian product-based multi-objective combination for dangerous object detection 2017-06-10 (17)Data-driven adaptive dynamic programming for two-player nonzero-sum game 2017-05-29 (18)Comparison of methods to efficient graph SLAM under general optimization framework 2017-05-19 (19)Policy gradient methods with gaussian process modelling acceleration 2017-05-16

确定
匹配导师

资料审核中

您的资料已提交成功!

我们的工作人员会将会在3-5个工作日内和您联系

返回