深度学习,是机器学习领域中一个新的研究方向,它被引入机器学习使其更接近于最初目标--人工智能。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。
它的终极目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。
目前,深度学习在搜索技术,数据挖掘,机器学习,机器翻译,自然语言处理,多媒体学习,语音,推荐和个性化技术,以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步。
简而言之,深度学习就是让机器像人一样主动去学习,目标就是人工智能。近年来,深度学习的进步已经成为推进AI技术发展的核心动力,让计算机进行练习,通过消化和分析大量数据,而不用明确编程,就可以达到目的。
年,谷歌以深度学习为基础的阿尔法狗(AlphaGo)击败了世界围棋冠军李世石,令大多数人工智能专家感到震惊,因为他们认为需要5-10年才能实现这一目标。而当谷歌于年底转向其新的深度学习AI系统后,它极大地提高了机器翻译的质量。
随着深度学习技术的不断发展,它还衍生出许多实际应用,主要是在推理与决策等方面取得了突破。然而,要让深度学习在学习如何超越图像、语音及自然语言处理方面做出更多成绩,比如对人类情感的理解,意识和动机的模仿,会涉及到很多更深层次的问题,是目前深度学习的黑匣子无法打开的魔方。
与所有技术的早期发展阶段一样,深度学习技术的发展似乎进入了瓶颈期,它必须克服许多严峻挑战。当前,深度学习所面临的主要挑战可以概括为以下几点:
一、数据匮乏
当代人工智能主要是由大数据驱动,因而数据可获得性、数据质量以及数据标注成本等是制约人工智能发展的一大因素。
深度学习的数据要求与许多维度中的其他分析方法的数据要求大不相同。随着数据集大小的增加,传统分析的性能趋于稳定。然而,随着数据集变大,正确训练的深度学习技术的性能将显著提高。
深度学习方法在从复杂的非结构化数据(包括音频,语音,图像和视频)中提取模式方面特别有价值。要做到这一点,需要成千上万的数据记录才能使模型在分类任务中变得更好,并且需要数百万的数据才能在人类层面上发挥作用。
凡是采用深度学习的地方都对标注数据有很高的依赖,相比人类而言,模型在学习新事物时需要更多的事例。
二、对标注数据依赖性大
我们目前的AI应用程序通过大量数据和深度学习算法的训练完成了一件事,即每个应用程序必须使用自己的数据集进行单独培训,即使对于与以前类似的用例也是如此。到目前为止,没有好的办法将培训从一种情况转移到另一种情况。
在实践中,深度学习体现出对标注数据依赖性大的特点,因此,模型具有领域依赖性,难以做到相互转移。当深度学习通过标注团队或众包经长时间迭代获得了大规模标注数据,训练好了模型,可是换了一个业务场景时,模型效果就会一落千丈。
三、不够透明
目前,深度学习的透明度问题尚未解决。深度学习需要解决其不透明性和黑匣子性质。用人类术语解释复杂深度学习应用的结果是相当困难的。典型的深度学习系统在其复杂的神经网络中具有大量参数,用人们所理解的方式评估各个节点对决策的贡献是非常困难的。
在一般情况下,在识别数据集中的猫时,这未必是一个问题。但对于医疗诊断或确定石油钻井平台安全性的模型来说,这就是一个相当重要的问题。在此情况下,监管机构希望对模型的透明度有一个良好的了解。
此外,在对金融交易等相关领域进行深度学习可能会产生责任,人类用户可能希望了解特定系统如何做出决定,而深度学习的不透明性将会导致严重的偏见问题。
四、模型缺乏理解和推理能力
目前深度学习对人类感情的理解还停留在浅层次的语义层面,不具备良好的推理能力,无法真正理解用户诉求。同时,如何将人类生活常识和背景知识融入模型训练,也是深度学习需要解决的瓶颈之一。
深度学习的开放式推理能力差(无法基于现实知识进行推理)。
未来的深度学习模型,除了能下围棋、解方程外,还能写诗、回答人们的各种常识性问题,才能满足人们对人工智能所具有功能的需求。
五、应用场景有限
当前虽然NLP有很多子领域,但是目前发展最好的方向依旧只有分类、匹配、翻译、搜索几种,大部分任务的应用场景依然受限。
闲聊机器人一般作为深度学习问答系统的兜底模块,在FAQ或意图模块没有命中用户提问时回复一个标准拟人话术。但如果在开放域直接应用闲聊机器人,很容易从人工智能走向人工智障,或只能得到一个近似的答案。
结语
正如人工智能领域顶级专家盖瑞·马库斯所指出,关于人工智能的炒作总是甚嚣尘上,但要得到真正可信的AI,却远比想象的要复杂得多,超级智能时代还远没有到来。创造真正可信的AI需要赋予机器常识和深度理解,而不是简单地分析数据。
深度学习作为人工智能的核心技术,关系到人工智能技术未来的发展,只有突破深度学习当前所面临的这一系列瓶颈,克服其局限性,才能创造出真正可信的人工智能。
事实上,深度学习是一个好的开始,但是不能解决一切问题,它未来的发展,需要和更高维度的方式叠加。而跨学科的研究会在语义、知识图谱、机器记忆、想象、逻辑推理等类人脑的领域,弥补深度学习的一些短板。
《深度学习》该书为深度学习领域奠基性经典畅销书,数据科学家和机器学习从业者必读,长期位居美亚AI和机器学习类图书榜首,图灵获奖作品。感兴趣的网友可以购买阅读。
深度学习(异步图书出品)京东月销量好评率99%无理由退换京东配送官方店¥84购买转载请注明:http://www.0431gb208.com/sjszlfa/3701.html