账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
强化学习:入门指南
 

【作者: Emmanouil Tzorakoleftherakis】2019年10月29日 星期二

浏览人次:【12202】

强化学习(Reinforcement learning)潜力无穷,能解决许多开发应用上面临的艰难决策问题,包括产业自动化、自主驾驶、电玩竞技游戏以及机器人等,因此备受瞩目。


强化学习是机器学习(Machine learning)的一种,指的是电脑透过与一个动态(dynamic)环境不断重复地互动,来学习正确地执行一项任务。这种尝试错误(trial-and-error)的学习方法,使电脑在没有人类干预、没有被写入明确的执行任务程式下,就能够做出一系列的决策。最著名的强化学习案例就是AlphaGo,它是第一支打败人类围棋比赛世界冠军的电脑程式。


强化学习的运作主要是仰赖动态环境中的资料—也就是会随着外部条件变化而改变的资料,像是天气或交通流量。强化学习演算法的目标,即是于找出能够产生最佳结果的策略。强化学习之所以能达成目标,是借着软体当中被称为主体 (agent)的部分在环境中进行探索、互动和学习的方法。
...
...

另一名雇主 限られたニュース 文章閱讀限制 出版品優惠
一般訪客 10/ごとに 30 日間 5//ごとに 30 日間 付费下载
VIP会员 无限制 20/ごとに 30 日間 付费下载
相关文章
CAD/CAM软体无缝加值协作
创新更容易!2024年受瞩目的Arduino创新产品简介
确保机器人的安全未来:资安的角色
双臂机器人引风潮 类人形应用尤欠东风
量子运算:打造自动驾驶汽车新领域
comments powered by Disqus
相关讨论
  相关新闻
» 高效能磁浮离心冰水机降低温室效应 工研院助大厂空调节电60%
» 传产及半导体业共享净零转型成果 产官学研联手打造净零未来
» 联合国气候会议COP29即将闭幕 聚焦AI资料中心节能与净零建筑
» 大同智能与台电联手布局减碳 启用冬山超高压变电所储能系统
» 台达能源「以大带小」 携手供应链夥伴低碳转型


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK8BR7OUNU6STACUK1
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw