现在的机器人有多厉害很可能超出大部分人的想象,很多人类的“默会知识”是很难描述清楚过程教会给机器的,我们人类学会的很多东西其实根本不知道是怎么学会的
比如识别一只猫,我们一眼就可以知道认得出来,但是根本不知道怎么做到的,以前让机器识别猫是非常困难的,可以试想一下有没有可能说清楚什么是猫,有四条腿,有胡须,身上有毛,那和狗又有什么区别呢,如果有人能用语言描述清楚什么是猫那就太厉害了
“深度学习”和“卷积算法”
人类的很多知识都是“只可意会”的,想要教会机器实在是太难了,当然现在机器在图像识别领域已经做得很好了,比如美国的谷歌公司依靠的是“深度学习”和“卷积算法”,是模拟人类大脑神经元“分层”的方法来实现的
比如提供几万张不同的图片告诉机器哪个是猫,再用几万张去测试验证,让机器根据答错答对的几率自己微调参数,识别率慢慢就提高了,不过对于机器自动调节的参数又要轮到人类不懂,不清楚机器为什么这样调,是怎么做到的,反过来可能又要向机器学习了
机器的“强化学习”,人工智能根本不智能!
机器的强化学习就是让机器去和环境试探性的交互逐步优化,差不多就是进行各种随机尝试,根据得到的即时反馈来逐步调整,类似于小朋友学习搭积木,大人在旁边进行即时反馈直到全部完成
但是对于机器这种方式需要设计很复杂的“奖励函数”才行,要给机器不停地反馈因为它没有真正的“理解”,就像经常说的“人工智能”其实根本不智能,有多少智能它的背后就有多少人工,所以简单的“强化学习”还是不够的,还要让机器学会从关键的中间状态重新探索,就是虽然没有成功但不至于全部推倒重来,从有意义的中间步骤重新探索就好
“关键状态重启”
升级版的机器人就需要使用“关键状态重启”的技术,以一定的概率继续从“半成品”继续工作,再结合“强化学习”的方法,让机器自己慢慢学会哪些是有意义的中间状态,但是这显然还是不够,人类还有一些特殊的能力,就是可以做出“预判”,大概知道之后可能发生的事,而这是程序化的机器不具备的,所以又使用了一种机器自监督的“逆转关系预测”
这个任务可以让机器人从前后两个不同状态中“理解”是什么动作导致了这种变化,比如一次没有成功,那一定要想办法让机器“理解”是什么原因,是做的过程有问题,还是做的这个动作有问题,要不然机器又不会思考,失败了就重新再来就会陷入无限循环,下次还是不会做出“预判”
“运动规划微调强化学习”
然而学会这些还是不够的,就算电脑模拟能做到现实中的机械,实际操作还是有区别的,还需要另外的机器学习方法“运动规划微调强化学习”,实现不同的步骤需要不同的策略,并且没有太多现成的东西可以直接拿来用
其实仔细想想应该也能理解机器学习的这个领域真的非常难,主要的问题就是没有人教你怎么样去教机器,有智力的人类面对只会按部就班执行程序的机器,就需要挖空心思用机器能够理解的方式帮助机器学习从而拥有“智能”
人工智能面对的其他“阻碍”
而更实际的问题是这个领域回报周期太长了,甚至不一定有回报,没有人才,时间,金钱的大量投入是做不出来的,所以当然是直接使用国外的一些研究成果更容易,等别人做出来再使用也会更加简单,但是未来难免受制于人
不过还好我们有清华大学这样的高等学府,在默默地做着这些研究,并且已经做出了成绩,看似简单的东西实际需要大量的付出,现在我国的人工智能已经可以做更复杂的工作了,它们肯定会“慢慢长大”越来越厉害
结语
其实更重要的是在实现这个过程中,所探索出来的“学习模型”被验证可行,那这些“策略”,“方法”,“模型”就可以被保留下来,这样就可以给整个机器人产业带来价值,哪怕只是把可行的“思路”分享出来,也可以给别人带来启发
转载请注明:http://www.0431gb208.com/sjszlfa/4901.html