全文共字,预计学习时长6分钟
机器学习包括自然语言处理(NLP)、计算机视觉、语音识别等等。计算机视觉问题极其复杂,目前提供的图像类似于对对象进行分类、识别或分割的像素矩阵。训练机器学习是一个迭代过程——通过调整不同的参数、超参数、重塑、添加或删除一个或多个层、连接或跳跃连接一个或多个残差块等来进行无休止的迭代。
为了对在数据集上执行不同算法的大量操作进行简化统一,可以选择IBMPowerAIVision。它将复杂的代码任务收集在一个即时信息中,让机器学习新手也能够创建、训练、调整、维护以及部署用于测试和生产环境的模型,从而学习或使用Web界面。
其以IBMPowerAI平台为核心,使用IBMPowerSystems支持的加速计算平台,同时支持PowerAIGPU/CPU的通信和并行性。深度学习模型的训练可以导入不同框架,如TensorFlow、Keras等,用作PowerAIVision平台的自定义模型。这些自定义模型可用作基本模型,其功能和性能指标可以通过在PowerAIVision中进行调整得到增强。如果使用自动标注功能,可以大大减少数据科学家的工作量。由于部署模型可跨平台使用,开发过程的成本也降低了。
下面进入实战:
使用PowerAIVision,仅需访问IBMPowerAIVision的官方网站,申请试用并填写详细信息,包括企业或单位的电子邮件地址。两个工作日内即可收到回复,届时会提供登录PowerAIVisionWebPortal的凭据。只需打开电子邮件中提供的链接,输入提供的凭据即可。
PowerAIVision登录界面
登录后将看到应用程序的问候界面,分为四个不同的选项:数据集(Datasets)、模型(Models)、自定义模型(CustomModels)、部署模型(DeployedModels)。
“数据集”允许上传不同的图像或视频作为输入制式。模型选项卡提供一些训练机器学习模型的选项,在指定不同的超参数之后,在选定的数据集中针对不同的预定义算法训练机器学习模型,从而促使算法更快、更准确地收敛。“自定义模型”允许将先前在PowerAIVision平台上训练的预训练视觉模型以.zip文件的格式导入,在更大程度上节省工作量和时间。
该平台可视为一个迁移学习的例子。为了能够对目标或分割图像进行分类,需要建立一个具有大量层数和数百万个参数、超参数、训练、开发和测试矩阵的深度神经网络模型。更重要的是,需要投入大量的计算和时间来训练网络。但这就是迁移学习的用途所在——并非从零开始,而是从预先训练的模型开始,特别是计算机视觉模型。这就是IBMPowerAIVision平台的作用——不仅简化了开销,而且还有效地为用户提供了计算能力和对数据的洞察力。
利用“部署模型”可以研究已经为生产环境部署的模型,可能对于客户来说,是通过不同的应用程序编程接口来支持表述性状态转移范式。例如,可以在开发的应用程序中使用以下API调用来识别、分类或分割结果。在对输入图像进行预测时,PowerAIVision还提供嵌入在输入图像顶部的热图(heatmap),以标示图像矩阵内的位置,这些位置有助于算法进行正确分类或识别图像中的对象。下面的API调用中已将true传递给containHeatMap,以获取该热图。
先从创建一个示例计算机视觉模型开始。例如,为无人机创建一个计算机视觉算法,以正确识别在洪水、地震或其他自然灾害中受损的房屋。本文已经用传统的深度神经网络(不是PowerAIVision)实现了一个完整的模型,目前处于实验室测试阶段。接下来演示的是,在IBMPowerAIVision平台上执行这样一项复杂的任务是多么容易,并且最终在PowerAIVision平台上获得了良好的分类准确度,无需过多调整,同时严格遵守算法训练、不同超参数的调整、不同算法的集成等迭代过程。
首先得到一些数据集。然后,为完成演示,将从互联网上下载一些受损房屋的图片。在这个演示中,本文只下载了40幅可能包含受损房屋的航拍图像,以及一些其他完好房屋的航拍图像。本文的数据集总共只有52张图片,远不足以进行生产阶段部署。接下来将使用PowerAIVision平台提供的工具来加入更多图像。
创建数据集或将其导入PowerAIVisionPortal
选择“创建新数据集”(Createnewdataset)或使用Import.zip文件导入一个数据集。等待图像和视频文件完成上传,上传过程完成后,将跳出类似以下的界面:
数据集页面:在创建/导入数据集后。
由于文件数量不多,算法就不会收敛了。所以,可以在上传的52张图片中增加更多的图片。只需单击“增加数据”(AugmentData),就能得到“裁剪”“旋转”“噪声”等其他选项,从而在原始图像中添加新图像,并以新命名创建新的数据集。根据输入图像或视频的大小,增加过程可能需要相当长的时间。增加过后,可从52个输入图像中生成近个文件。
增加数据后
初始数据集训练
完成增加后,在标记为完整房屋的对象中有幅图像归类为完整房屋,个标记为受损房屋的对象中有幅图像被归类为受损房屋。
该数据集不是用于生产的计算机视觉项目,只用于演示。因此,下一步将从生成的图像中训练一个算法。点击“训练模型”(TrainModel),选择对象识别模型,然后选择使用faster-RCNN算法训练的模型,以获得更高的准确性。点击高级选项来进一步微调超参数,如最大迭代次数、梯度下降动量、训练与测试/验证集之比、学习速率、用于正则化的权值衰减以减少过拟合的可能性。
PowerAIVision平台的训练将在GPU上进行。默认情况下,PowerAIVision上的每个试用帐户都可以访问12个GPU,从而大大减少了训练模型的时间。训练过程中可看到一个实时的损耗与迭代的关系图,随着迭代的增加,损耗会减少。培训完成后会出现部署模型和导出模型的选项。只需单击“部署模型”(DeployModel)或“部署和导出模型”(DeployandExportModel),即可完成部署来进行生产。如下图所示,本模型使用了选定的超参数,执行的准确度为%。
模型评价指标
模型训练完成时,可以查看不同的算法度量来分析模型的实际执行情况,包括混淆矩阵、迭代与损耗图等等。操作方法为:在“模型”(Models)选项中单击刚刚创建的模型,打开“高级度量”(AdvancedMetrics)选项。
混淆矩阵与训练模型的精确度-检索率曲线
接下来用两个不同的例子来测试已创建的模型是如何识别受损房屋和完整房屋的。若要使用自己的图像进行测试,请在“已部署模型”(DeployedModels)中单击刚部署的模型,打开详细信息,然后在“测试模型”(Testmodel)中导入图像或链接到指向对象,或使用直接点击“导入”(Import)。
用两张网上下载的图像进行演示。一张是一座失修的房子,另一张是一座豪华别墅。接下来观察算法的执行情况。设置0.5作为算法进行预测的置信度阈值。
对失修房屋进行目标检测的算法
对完整房屋进行目标检测的算法
可见,该模型运行得非常准确。由于使用了正则化术语,过拟合的可能性非常小。但由于数据较少,该模型不适用于生产环境。现在,使用此模型作为基础模型,可以训练不同数据集的模型。使用此模型可自动标记新数据集中的对象,调整超参数,在同一位置创建整体模型。
自动标记数据集表示使用先前部署的模型自动标记数据集中的对象。这个过程中会向图像中添加更多的数据,模型的性能就会提高。
可以通过下面的链接获得这个演示的基本部署模型。可能需要一个IBMPowerAIVision帐户来访问模型。
留言点赞
转载请注明:http://www.0431gb208.com/sjszlff/4019.html