PyTorch的深度学习框架由于其相对易用性而已渗透到企业中。迪士尼告诉我们为什么他们选择PyTorch而不是Google著名的TensorFlow框架。
深度学习是机器学习的一个子类,它使用多层神经网络来自动化规模较大的历史悠久的机器任务,例如图像识别,自然语言处理(NLP)和机器翻译。TensorFlow于年从Google脱颖而出,一直是研究和商业领域最受欢迎的开源深度学习框架。但是PyTorch于年从Facebook上脱颖而出,由于社区推动的易用性和部署方面的改进(适用于广泛的用例)而迅速赶上了潮流。
PyTorch在汽车工业中得到了特别广泛的采用,可将其应用于Tesla和LyftLevel5等飞行员的自动驾驶系统。该框架还用于媒体公司中的内容分类和推荐,并在工业应用中帮助支持机器人。FacebookAI人工智能产品负责人JoeSpisak告诉InfoWorld,尽管他对PyTorch在企业中的采用率增加感到高兴,但要获得更广泛的行业采用率,还有许多工作要做。
他说:“下一波采用将伴随着生命周期管理,MLOps和Kubeflow管道以及相关社区的出现。”“对于那些刚开始的人来说,这些工具相当不错,可以使用托管服务和一些开源软件,以及AWS或AzureML上的SageMaker之类的软件来开始使用。”
迪士尼:识别电影中的动画面孔
自年以来,媒体巨头迪斯尼的工程师和数据科学家一直在构建公司所谓的内容基因组,该知识图将内容元数据汇总在一起,为整个迪士尼的庞大内容库中基于机器学习的搜索和个性化应用程序提供支持。
“此元数据改进了迪士尼讲故事的人用来产生内容的工具;在讲故事中激发迭代创造力;通过推荐引擎,数字导航和内容发现来增强用户体验;并支持商业智能。”迪士尼开发商MiquelngelFarré,AnthonyAccardo,MarcJunyent,MonicaAlfaro和CescGuitart在7月的博客中写道。
在此之前,迪斯尼必须投资一个庞大的内容注释项目,转向其数据科学家来训练使用深度学习模型进行图像识别的自动标记管道,以识别大量人物,角色和位置的图像。迪斯尼工程师首先尝试了包括TensorFlow在内的各种框架,但于年决定在PyTorch周围进行整合。工程师从传统的定向梯度直方图(HOG)特征描述符和流行的支持向量机(SVM)模型转变为具有卷积神经网络(R-CNN)的对象检测架构称为区域。后者更有利于处理迪士尼内容中常见的实景动作,动画和视觉效果的组合。
迪士尼研究工程师莫妮卡·阿尔法罗(MonicaAlfaro)向InfoWorld解释说:“很难定义卡通中的面孔,因此我们转向了使用对象检测器的深度学习方法,并使用了转移学习。”在仅处理了几千张面孔之后,新模型已经在所有三个用例中广泛地识别了面孔。它于年1月投入生产。
她说:“我们现在仅使用一种模型来处理三种类型的面孔,这非常适合在《复仇者联盟》这样的奇迹电影中运行,因为该电影需要识别钢铁侠和托尼·史塔克,或者任何戴着面具的人物。”工程师正在处理如此大量的视频数据以并行训练和运行模型时,他们还希望在投入生产时在昂贵的高性能GPU上运行。
CPU的转变使工程师可以更快地重新训练和更新模型。它还加快了将结果分发到整个迪士尼的各个小组的速度,将处理时间从一部长篇电影的大约一小时缩短到如今的五到十分钟之间。“TensorFlow对象检测器在生产中带来了内存问题,难以更新,而PyTorch具有相同的对象检测器和Faster-RCNN,因此我们开始对所有内容使用PyTorch,”Alfaro说。
从一个框架到另一个框架的转换对于工程团队来说也非常容易。“对[PyTorch]的更改很容易,因为它完全是内置的,您只需插入一些功能就可以快速启动,因此学习难度并不高,”Alfaro说。当他们遇到任何问题或瓶颈时,充满活力的PyTorch社区将随时为您提供帮助。
转载请注明:http://www.0431gb208.com/sjszlff/5634.html