过去几年中,深度学习中的很多技术如计算机视觉、自然语言处理等被应用在很多实际问题中,而且相关成果也表明深度学习能让人们的工作效果比以前更好。
我们收集了一些深度学习方面的创意应用,虽然没有对每项应用进行详尽描述,但是希望你看过之后能对深度学习在生活中的应用潜力有更好的认识,我们在每项应用后也尽量补充了相关资料,比如代码、教程网站和研究论文等,应该会对大家的学习有所帮助。
文末附项目资料领取方式
给黑白照片自动上色
为黑白照片添加颜色又叫做图像着色。很久以来,这项工作都是由人工完成,是一项颇为艰巨的任务。现在人们可以用深度学习技术利用物体及它们在照片里的环境来给图像着色,和人工完成的效果几无差别。
为了解决图像着色问题,要给ImageNet(目前世界上图像识别最大的数据库)训练一个质量很高、规模很大的卷积神经网络。总的来说,就是采用了非常大的卷积神经网络和监督层(supervisedlayers),添上色彩,然后重建照片。
例如,芝加哥大学的技术人员去年4月份发表研究成果称,用深度学习技术和英伟达GPU实现了为黑白照片自动上色。
左为黑白照片,右为深度学习技术上色后的照片
问题来了,我们从哪里可以体验一下呢?从Algorithmia网站上就行,打开网站输入你要上色的照片,然后点击“Colorizeit”,就OK了!
拿张黑白喵图举个栗子
自动机器翻译
这种应用也就是能把一种语言的词汇、短语和句子自动翻译成另一种语言。其实这种自动机器翻译技术很久前就应用了,但是深度学习可以在两个细分方面达到登峰造极的成果:
自动翻译文本自动翻译图片采用深度学习技术的文本翻译无需提前处理文字的序列,算法能够学习词汇和它们的映射之间的关系,然后翻译为另一种语言。大型LSTM循环神经网络中的堆叠网络(stackednetworks)就可以用来完成这种翻译。
卷积神经网络也能用来识别有文字的照片,将照片中的文字转换为文本格式,然后翻译加工,最后照片会变为配有翻译后文字的照片。通常也被称为即时视觉转译。
谷歌翻译应用就采用了深度学习技术,能够实现27种语言的即时视觉转译。
对照片中物体进行分类和检测
就是将照片中的物体进行分类,归为人们已知的物体。利用大型卷积神经网络在这方面已经取得了瞩目的成就。例如,由神经网络专家AlexKrizhevsky,GeoffreyHinton和IlyaSutskever共同研发的AlexNet便是其中的佼佼者。
资料来源:
转载请注明:http://www.0431gb208.com/sjszyzl/3665.html