在东京一栋外观低调的办公建筑里面,住着一个异常聪明的由日本Fanuc公司造出来的 工业机器人 。给机器人一个任务,比如从一个盒子里拾取小工具然后放入另一个容器里,机器人将用整个晚上想出如何完成任务。到了清晨,机器居然掌握了这项工作,就好像是一位专家为它设定了程序一样。
在十二月份,Fanuc在东京国际机器人展览会上展示了一台经强化学习训练的机器人
工业机器人可以有极好的精确度和速度,但是它们通常需要人非常谨慎的编写程序,从而做一些像抓取物品这样的事。这是很困难且耗费时间的,意味着这样的机器人往往只能在高度控制的环境中工作。
Fanuc的机器人使用了一种名为深度强化学习的技术,来训练它自己,可随时学习新的任务。它在尝试拾起物品的同时,能够抓取这个过程的录像。不管每次它是成功了还是失败了,它都会记住物品长什么样的,用它学到的知识改进控制它行动的深度学习模型或大型神经网络。在过去几年,深度学习被证明是模式识别领域中的一条强有力的途径。
机器学习。「它整晚都在工作;到了第二天早晨,它调整好了。」
机器人研究员正在测试强化学习,将它作为一种简化和加快工厂机器人编写程序的手段。这个月早期,Google发布了自己研究使用强化学习教机器人如何抓紧物品的细节信息。
Fanuc机器人是由Preferred Networks编写程序。Fanuc这家世界最大的工业机器人生产商,去年八月对PreferredNetworks投资了730万美元。这家两家公司去年12月在东京的国际机器人展览会上展示了这个学习型机器人。