爱吧机器人网 » 技术 > 人工智能 > 正文

人工智能:什么是强化学习?

强化学习是人工智能(AI)中讨论最多、关注最多和考虑最多的话题之一,因为它有可能改变大多数企业。什么是强化学习?强化学习的核心是一个概念,即最佳的行为或行动是由积极的回报来强化的。机器和软件代理使用强化学习算法,通过以环境的反馈为基础来确定理想行为,这是机器学习的一种形式,也是人工智能的一个分支。

人工智能:什么是强化学习?
根据问题的复杂性,强化学习算法可以在必要时随时间保持适应环境,以便长期获得最大的回报。一个通过强化学习来学会行走的机器人将通过尝试不同的方法实现目标,获得有关这些方式成功的反馈,然后进行调整直到达到行走的目标。大步伐会让机器人摔倒,通过调整步距来判断这是否是保持直立的原因,通过不同的变化持续学习,最终能够行走。以上说明,奖励是保持直立,惩罚就是摔倒,机器人基于对其动作的反馈信息进而优化并强化。强化学习需要大量的数据,这就是为什么这项技术的第一个应用领域是模拟数据,如游戏和机器人。

人工智能:什么是强化学习?
尽管处于强化学习的早期阶段,但仍有一些应用和产品开始依赖这种技术。公司开始使用强化学习解决连续性决策问题,同时强化学习支持专家决策或自动化决策处理。

机器人。强化学习为机器人学提供了“框架和一套工具”,用于处理难以设计的行为。由于强化学习可以在没有监督的情况下进行,这可以帮助机器人倍速增长。

工业自动化。得益于DeepMind(深度思维公司)的强化学习能力,谷歌能够显著降低其数据中心的能源消耗。近期被微软收购的Bonsai公司提供了一种强化学习解决方案,可以在能源、暖通空调、制造、汽车和供应链中实现自动化和“将智能构建到复杂的动态系统中”。

加强预见性维护。机器学习已经在制造业中使用了一段时间,但强化学习可以使预测性维护比现在更好。

博弈。事实上,强化学习的第一个应用是当机器学习算法AlphaGo在围棋中战胜世界上最好的人类棋手之一时一战成名,现在强化学习被用于各种游戏的竞争。

医学。强化学习非常适合于为健康状况和药物治疗找出最佳的治疗方法,还被用于临床试验以及医疗保健的其他应用。

对话系统。由于公司以客户咨询、合同、聊天机器人等形式接收大量的抽象文本,因此,将强化学习用于文本摘要的解决方案备受推崇。这些工具的内在特性是,随着时间的推移会变得更好。

个性化。无论是你使用的媒体、针对你展现的广告,还是你计划购物平台上购买的商品,都有强化学习算法在幕后发挥作用,以创造一流的客户体验。

自动驾驶。大多数自动驾驶汽车、卡车、无人驾驶飞机和船只的核心都有强化算法。英国Wayve公司设计了一款自动驾驶汽车,通过强化学习能在20分钟内学会驾驶。

人工智能:什么是强化学习?
由于强化学习运行需要大量的数据集,因此大多数公司想要利用强化学习的能力需要获取更多的数据,并且随着强化学习的价值不断上生,公司将继续对资源进行投资,以便找出在其运营、服务和产品中实现该技术的最佳方式。



上一篇:Endor(EDR)使人工智能预测惠及全人类
下一篇:人工智能的突破性和经证实的好处
精选推荐

[2018-01-26]  纽约时报的报道,德国的研究人员已经开发出一种长约七分之一英寸的机器人,首先看起来不过是一小块橡皮条。然后它开始移动。机器人走路,跳跃,爬行,滚动和游泳。它甚至爬出......

人工智能准确预测患者一年内的死亡风险,原理却无法解释
人工智能准确预测患者一年内的死亡风险,原理却无法解释

[2019-11-13]  图片来自BURGER PHANIE SCIENCE PHOTO LIBRARY美国最新研究显示,人工智能通过查看心脏测试结果,以高达85%以上的准确率预测了一个人在一 ...

九台“猎豹”机器人组队踢球,麻省理工高材生们的高级趣味
九台“猎豹”机器人组队踢球,麻省理工高材生们的高级趣味

[2019-11-09]  本周,在麻省理工学院10号楼外草坪上展开了一场别开生面的足球比赛。在绿草如茵的基利安球场上,一群由人工智能驱动的机器人就是这场比赛的 ...

这个外科手术机器人可以为患者“量身定制”
这个外科手术机器人可以为患者“量身定制”

[2019-07-12]  世界首创,来自澳大利亚机器人视觉研究中心的研究人员正在推动手术机器人的发展边界,他们创造了可定制的、小型化的手术机器人,能够唯一地 ...

Waymo:人性和行为心理学才是无人驾驶最大的挑战
Waymo:人性和行为心理学才是无人驾驶最大的挑战

[2019-11-03]  自动驾驶汽车作为AI领域内最大的挑战之一,谷歌致力于其研发已有十余载,现在他们逐渐意识到,最困难的是如何让人们享受驾驶的乐趣。这是一 ...

美国人工智能公司Skymind进入福建全面开展业务
美国人工智能公司Skymind进入福建全面开展业务

[2017-12-11]  人工智能在当今这个时代对大家来说想必是非常熟悉的,这也是我国近十几年来一直追求的目标,未来的时间里这也将是全人类追求的目标。就目前来看,近年来,人工智能或在我国迎......

什么是机器人学?机器人学简介
什么是机器人学?机器人学简介

[2017-12-14]  机器人学是工程学与科学的交叉学科,包括机械工程,电气工程,计算机科学等。机器人技术涉及机器人的设计、制造、操作和应用,以及用于控制、感官反馈和信息处理的计算机系统。...

MIT最新“人机”互连系统 让双腿机器人复制人体技能
MIT最新“人机”互连系统 让双腿机器人复制人体技能

[2019-11-01]  MIT的小爱马仕想借用你的大脑 ,图片来自: João Ramos爱吧机器人网消息,麻省理工学院(MIT)的研究人员展示了一种新型遥操作系 ...

本周栏目热点

说一说那些进入日常生活的智能机器人

[1970-01-01]    从《星球大战》里的机器人英雄,到前些年大受欢迎的电影《我,机器人》,无数的科幻作品里都少不了机器人元素,人们将之视为 未来感的 ...

奇点大学:人工智能与“奇点理论”

[1970-01-01]    就在前几天和行业内的几个朋友吃饭时,内容在不经意间又转向了那个老生常谈的话题-到底什么是在智能电视上最好的交互方式上,于是乎五 ...

说客小π情感机器人体验【评测】

[2015-12-29]     前言  随着语音识别技术的发展,声控灯、语音输入法、语音交互等各具特色 ...

Facebook人工智能机器人生成照片以假乱真

[1970-01-01]    无论你是否认为面部识别令人毛骨悚然,很明显全球多家科技公司正在继续投资开发更强大的图像智能技术。  无论是微软的猜年龄机器人, ...

麻省理工智能机器人最新技术 机器手指研究获得突破

[2015-12-27]     麻省理工智能机器人最新消息,今年在研究机器手方面跨出了一大步,现在它又 ...