教你学Python43我如何开始机器学

来源：语言识别时间：2023/4/3

我被问到的最常见问题是：“我如何开始？”

我对机器学习入门的最佳建议分为五个步骤：

步骤1：调整心态。相信您可以练习并应用机器学习。是什么让您从机器学习目标中退缩？为什么机器学习不必这么难如何思考机器学习找到您的机器学习部落步骤2：选择一个流程。使用系统的过程来解决问题。应用机器学习过程步骤3：选择一个工具。为您的关卡选择一个工具，并将其映射到您的过程中。初学者：WekaWorkbench。中级：Python生态系统。进阶：RPlatform。机器学习的最佳编程语言步骤4：练习数据集。选择要处理的数据集并实践该过程。使用小型内存数据集练习机器学习现实世界机器学习问题之旅研究与您息息相关的机器学习问题步骤5：建立投资组合。收集结果并展示您的技能。建立机器学习档案袋获得报酬以应用机器学习机器学习赚钱有关此自顶向下方法的更多信息，请参见：

机器学习精通方法程序员的机器学习我的许多学生都使用这种方法在Kaggle比赛中继续表现出色，并获得了机器学习工程师和数据科学家的工作。

应用机器学习过程

机器学习的好处是预测和做出预测的模型。

拥有应用机器学习的技能意味着知道如何始终如一地可靠地对问题进行高质量的预测。您需要遵循系统的流程。

您可以按照以下5个步骤进行操作，以在预测建模问题上始终如一地获得高于平均水平的结果：

步骤1：定义您的问题。如何定义您的机器学习问题第2步：准备数据。如何为机器学习准备数据如何识别数据中的异常值通过数据预处理提高模型精度探索特征工程特征选择简介在您的机器学习数据集中打击不平衡类的策略机器学习中的数据泄漏第3步：抽查算法。如何评估机器学习算法为什么应该在机器学习问题上采用抽查算法评估机器学习算法时如何选择正确的测试选项一种数据驱动的机器学习算法选择方法步骤4：改善结果。如何改善机器学习结果机器学习性能改进备忘单如何提高深度学习表现步骤5：呈现结果。如何使用机器学习结果如何训练最终的机器学习模型如何将预测模型部署到生产中有关此过程的完整摘要，请参见以下文章：

应用机器学习过程如何使用机器学习清单来获得准确的预测机器学习的概率

概率是量化和控制不确定性的数学。它是许多数学领域（如统计学）的基石，对于应用机器学习至关重要。

以下是3个步骤的过程，您可以使用它来快速掌握机器学习的可能性。

第1步：发现概率。机器学习的数学符号基础什么是概率？步骤2：了解为什么概率对机器学习如此重要。学习机器学习概率的5个理由机器学习不确定性的温和介绍步骤3：研究“概率”主题。机器学习迷你课程的概率机器学习的概率（我的书）您可以在此处查看有关概率的所有教程。以下是一些最受欢迎的教程。

概率基础

联合概率，边际概率和条件概率简介联合概率，边际概率和条件概率的直觉不同类型概率的有效示例贝叶斯定理

机器学习的贝叶斯定理的简要介绍使用Python从头开始开发NaiveBayes分类器在Python中从头开始实现贝叶斯优化概率分布

温和介绍概率分布机器学习的离散概率分布机器学习的连续概率分布信息论

信息熵的简要介绍计算概率分布之间的差异机器学习的交叉熵的温和介绍机器学习统计

统计方法是深入了解机器学习算法行为所必需的重要数学基础领域。

下面是3个步骤的过程，您可以用来快速掌握用于机器学习的统计方法。

步骤1：发现什么是统计方法。什么是统计（以及为什么它在机器学习中很重要）？步骤2：了解统计方法为何对机器学习很重要。应用统计与机器学习之间的密切关系10个如何在机器学习项目中使用统计方法的示例步骤3：深入探讨“统计方法”的主题。机器学习统计（7天迷你课程）机器学习的统计方法（我的书）您可以在此处查看所有统计方法的帖子。以下是一些最受欢迎的教程。

统计摘要

5号摘要简介数据可视化简介了解变量之间关系的相关性计算常规汇总统计信息简介统计假设检验

Python中的15种统计假设检验（备忘单）统计假设检验简介非参数统计显着性检验简介参数统计显着性检验简介比较算法的统计显着性检验重采样方法

统计采样和重采样简介引导简介交叉验证简介估算统计

估计统计简介置信区间简介预测间隔简介公差间隔简介机器学习的线性代数

线性代数是实现对机器学习算法的更深入理解所需的重要数学基础领域。

以下是3个步骤，您可以用来快速学习线性代数以进行机器学习。

步骤1：发现什么是线性代数。机器学习的数学符号基础线性代数的温和介绍步骤2：了解线性代数为何对机器学习很重要。学习机器学习的线性代数的5个理由机器学习中的10个线性代数示例机器学习的线性代数步骤3：研究线性代数主题。机器学习迷你课程的线性代数机器学习的线性代数（我的书）您可以在此处查看所有线性代数的帖子。以下是一些最受欢迎的教程。

Python中的线性代数

Python中的N维数组简介如何索引，切片和重塑NumPy数组矩阵

矩阵与矩阵算术简介线性代数中的矩阵类型简介机器学习矩阵运算简介机器学习张量简介向量

向量简介向量规范简介矩阵分解

矩阵分解简介特征分解导论奇异值分解（SVD）简介主成分分析（PCA）简介了解机器学习算法

机器学习与机器学习算法有关。

您需要知道哪些算法可用于给定问题，它们如何工作以及如何最大程度地利用它们。

这是机器学习算法的入门方法：

第1步：发现不同类型的机器学习算法。机器学习算法之旅步骤2：发现机器学习算法的基础。机器学习算法如何工作参数和非参数算法有监督和无监督算法偏差-偏差的权衡用算法过度拟合和不足拟合步骤3：了解顶级机器学习算法的工作原理。机器学习算法迷你课程精通机器学习算法（我的书）您可以在此处查看所有机器学习算法文章。以下是一些最受欢迎的教程。

线性算法

梯度下降线性回归逻辑回归线性判别分析非线性算法

分类和回归树朴素贝叶斯K最近邻居学习向量量化支持向量机合奏算法

套袋和随机森林Boosting和AdaBoost如何学习/学习机器学习算法

了解机器学习算法的5种方法如何学习机器学习算法如何学习机器学习算法如何研究机器学习算法如何研究机器学习算法的行为通过创建机器学习算法列表来控制理解任何机器学习算法的6个问题Weka机器学习（无代码）

Weka是一个平台，您可以使用它来开始应用机器学习。

它具有图形用户界面，这意味着无需编程，并且提供了一套最新的算法。

这是您如何开始使用Weka的方法：

步骤1：发现Weka平台的功能。什么是Weka机器学习工作台第2步：探索如何绕过Weka平台。如何下载和安装Weka机器学习工作台Weka机器学习工作台之旅步骤3：探索如何使用Weka交付结果。如何在Weka中运行您的第一个分类器Weka迷你课程的应用机器学习Weka精通机器学习（我的书）您可以在此处查看所有Weka机器学习文章。以下是一些最受欢迎的教程。

在Weka中准备数据

如何在Weka中加载CSV机器学习数据如何在Weka中更好地理解您的机器学习数据如何在Weka中标准化和标准化您的机器学习数据如何使用Weka处理机器学习数据中的缺失值如何在Weka中使用机器学习数据执行特征选择Weka算法教程

如何在Weka中使用机器学习算法如何在Weka中估计机器学习算法的性能如何在Weka中使用回归机器学习算法如何在Weka中使用分类机器学习算法如何在Weka中调整机器学习算法Python机器学习（scikit-learn）

Python是应用机器学习发展最快的平台之一。

您可以在模型的开发和操作部署中使用相同的工具，例如pandas和scikit-learn。

以下是您可以用来开始使用Python机器学习的步骤：

第1步：发现Python用于机器学习Scikit-Learn的简要介绍：Python机器学习库步骤2：探索Python机器学习的生态系统。面向机器学习开发人员的Python速成课程机器学习的Python生态系统Python是应用机器学习的成长平台步骤3：探索如何使用Python中的机器学习解决问题。您的Python循序渐进的第一个机器学习项目Python机器学习迷你课程精通Python的机器学习（我的书）您可以在此处查看所有Python机器学习文章。以下是一些最受欢迎的教程。

用Python准备数据

如何在Python中加载机器学习数据使用Python中的描述性统计信息了解您的机器学习数据使用Pandas可视化Python中的机器学习数据如何使用Scikit-Learn为Python中的机器学习准备数据Python中机器学习的功能选择Python机器学习

评估机器学习算法的性能评估Python中机器学习算法的指标带有scikit-learn的Python中的抽查分类机器学习算法带有scikit-learn的Python中的抽查回归机器学习算法如何在scikit-learn中比较Python中的机器学习算法R机器学习（插入符号）

R是用于统计计算的平台，并且是专业数据科学家中最受欢迎的平台。

它之所以受欢迎，是因为有大量可用的技术，并且由于这些方法的强大接口（例如强大的插入符号程序包）。

这是R机器学习的入门方法：

第1步：了解R平台及其流行的原因。什么是R使用R进行机器学习R中的超级快速速成课程步骤2：探索R中的机器学习算法。如何开始使用R中的机器学习算法步骤3：发现如何使用R中的机器学习解决问题。您的R循序渐进的第一个机器学习项目R机器学习迷你课程精通R的机器学习（我的书）您可以在这里查看所有R机器学习文章。以下是一些最受欢迎的教程。

R中的数据准备

如何将机器学习数据加载到R中使用描述性统计信息更好地理解R中的数据使用可视化更好地理解R中的数据使用CaretR软件包进行功能选择通过预处理为R中的机器学习做好数据准备R中的应用机器学习

如何使用R评估机器学习算法R中的抽查机器学习算法R中的调音机器学习算法如何在R中构建机器学习算法的集合比较R中机器学习算法的性能从零开始的代码算法（Python）

通过从头开始编码，您可以学到很多有关机器学习算法的知识。

通过编码学习是许多开发人员和工程师的首选学习方式。

这是通过从头开始编写所有代码来开始机器学习的方法。

第1步：从零开始发现编码算法的好处。从头开始实施机器学习算法的好处从头开始实施以了解机器学习算法步骤2：发现从头开始编码算法只是一种学习工具。从头开始停止编码机器学习算法实施机器学习算法时不要以开源代码开头第3步：探索如何使用Python从头开始编写机器学习算法。从零开始的机器学习算法（我的书）您可以在此处查看Scratch帖子中的所有代码算法。以下是一些最受欢迎的教程。

准备数据

如何从头开始加载机器学习数据如何从头开始扩展机器学习数据线性算法

如何从零开始实现简单的线性回归如何从头开始实现感知器算法算法评估

如何从头开始编写重采样方法如何从头开始编写算法性能指标非线性算法

如何从头开始编写反向传播算法如何从头开始编写决策树算法时间序列预测简介（Python）

时间序列预测是业务应用程序中的重要主题。

许多数据集包含一个时间成分，但是从机器学习的角度来看，很少涉及时间序列的主题。

以下是时间序列预测的入门方法：

步骤1：发现时间序列预测。什么是时间序列预测？第2步：发现时间序列为监督学习。时间序列预测作为监督学习第3步：探索如何善于利用时序预测提供结果。使用Python迷你课程进行时间序列预测使用Python进行时间序列预测（我的书）您可以在此处查看所有时间序列预测帖子。以下是一些最受欢迎的教程。

数据准备教程

用于机器学习的7个时间序列数据集如何在Python中加载和探索时间序列数据如何在Python中标准化和标准化时间序列数据使用Python中的时间序列数据进行基本特征工程如何回测时间序列预测的机器学习模型预测教程

如何使用Python进行时间序列预测的基线预测如何使用Python检查时间序列数据是否固定如何使用Python创建ARIMA模型进行时间序列预测如何使用Python网格搜索ARIMA模型超参数如何完成时间序列预测项目Python中的XGBoost（随机梯度增强）

XGBoost是梯度提升决策树的高度优化实现。

它之所以受欢迎，是因为它被世界上一些最好的数据科学家用来赢得机器学习竞赛。

这是XGBoost入门的方法：

步骤1：发现梯度提升算法。机器学习的梯度提升算法简介第2步：发现XGBoost。XGBoost应用机器学习的温和介绍步骤3：探索如何善于利用XGBoost交付结果。如何使用scikit-learn在Python中开发您的第一个XGBoost模型XGBoost与Python迷你课程XGBoostWithPython（我的书）您可以在此处查看所有XGBoosts帖子。以下是一些最受欢迎的教程。

XGBoost基础

在Python中使用XGBoost进行梯度增强的数据准备如何在Python中使用XGBoost评估梯度提升模型通过尽早停止使用Python中的XGBoost来避免过度拟合使用XGBoost在Python中进行功能重要性和功能选择XGBoost调整

如何配置梯度提升算法在Python中使用XGBoost进行梯度提升时的音调学习速率在Python中使用XGBoost和scikit-learn进行随机梯度增强如何在Python中使用XGBoost调整决策树的数量和大小如何在Python中优化对XGBoost的多线程支持分类不平衡

不平衡分类是指分类任务，其中一类的实例比另一类更多。

这些类型的问题通常需要使用专门的性能指标和学习算法，因为标准指标和方法不可靠或完全失败。

这是不平衡分类的入门方法：

步骤1：发现不平衡分类的挑战关于不平衡分类的简要介绍步骤2：发现倾斜的类分布的直觉。为严重偏斜的班级分配建立直觉步骤3：发现如何解决不平衡分类问题。Python7天迷你课程的不平衡分类（即将推出）Python的不平衡分类（我的书）您可以在此处查看所有不平衡分类的帖子。

深度学习（Keras）

深度学习是一个引人入胜且强大的领域。

最新的结果来自深度学习领域，它是机器学习的一个子领域，不容忽视。

这是开始深度学习的方法：

步骤1：发现深度学习的全部内容。什么是深度学习？8深度学习的启发性应用第2步：发现最佳工具和库。Python深度学习库Theano简介Python深度学习库TensorFlow简介Keras的Python深度学习简介步骤3：发现如何解决问题并交付结果。使用Keras逐步开发Python中的第一个神经网络Python迷你课程中的应用深度学习使用Python进行深度学习（我的书）您可以在此处查看所有深度学习文章。以下是一些最受欢迎的教程。

背景

多层感知器神经网络速成课程卷积神经网络机器学习速成课程递归神经网络深度学习速成课程多层感知器

Keras中神经网络模型的5步生命周期如何使用Keras在Python中为深度学习模型网格搜索超参数保存和加载Keras深度学习模型在Keras中显示深度学习模型培训历史Keras深度学习模型中的辍学正则化卷积神经网络

使用Keras在Python中使用卷积神经网络进行手写数字识别Keras深度学习库中具有卷积神经网络的目标识别使用深度学习从电影评论中预测情感递归神经网络

使用Keras在Python中使用LSTM递归神经网络进行时间序列预测使用Keras理解Python中的状态LSTM递归神经网络使用Keras在Python中使用LSTM递归神经网络生成文本更好的深度学习表现

尽管定义和拟合深度学习神经网络模型很容易，但是要在特定的预测建模问题上获得良好的性能可能会充满挑战。

您可以使用标准技术来改善学习，减少过度拟合并通过深度学习模型做出更好的预测。

这是开始获得更好的深度学习性能的方法：

步骤1：发现深度学习的挑战。为什么训练神经网络很困难训练深度学习神经网络模型的挑战第2步：发现用于诊断和改善模型性能的框架。如何提高深度学习表现更好的深度学习框架诊断模型性能的学习曲线简介步骤3：发现可用于提高性能的技术。如何获得更好的深度学习成果（7天迷你课程）更好的深度学习（我的书）您可以在此处查看所有更好的深度学习文章。以下是一些最受欢迎的教程。

更好的学习（修复培训）

如何使用节点和层控制模型容量训练神经网络时如何选择损失函数了解学习率对模型性能的影响如何使用ReLU修复消失的渐变更好的泛化（修复过度拟合）

正则化以减少神经网络的过度拟合如何使用重量衰减来减少过度拟合如何通过辍学正则化减少过度拟合如何使用早期停止在正确的时间停止训练更好的预测（合奏）

深度学习神经网络的集成方法如何开发平均模型集成如何开发交叉验证和装袋集成如何开发堆叠式深度学习组合提示，技巧和资源

配置反向传播的8个技巧贸易评论技巧深度学习从业人员的三本必备书籍数据集大小对深度学习模型技能的影响长短期记忆网络（LSTM）

长短期记忆（LSTM）递归神经网络是为序列预测问题设计的，是用于挑战性预测问题的最新深度学习技术。

这是在Python中开始使用LSTM的方法：

步骤1：发现LSTM的前景。递归神经网络用于时间序列预测的承诺步骤2：发现LSTM在哪里有用。用序列进行预测专家对长短期记忆网络的温和介绍序列预测模型简介步骤3：发现如何在项目中使用LSTM。Keras中长短期记忆模型的5个步骤生命周期长短期记忆网络（迷你课程）使用Python的长期短期记忆网络（我的书）您可以在此处查看所有LSTM帖子。以下是通过Keras深度学习库在Python中使用LSTM的一些最受欢迎的教程的精选。

LSTM的数据准备

如何为长短期存储网络重塑输入数据如何对序列数据进行热编码如何使用差异转换删除趋势和季节性如何为长期短期存储网络扩展数据如何为截断的BPTT准备序列预测如何处理序列预测问题中缺少的时间步LSTM行为

温和反向传播的温和介绍带有长短期记忆网络的记忆演示如何将时间分布层用于长短期内存网络如何使用编码器-解码器LSTM来回波随机整数长短期记忆循环神经网络中的注意事项用LSTM建模

生成长期短期记忆网络堆叠式长短期记忆网络编解码器长短期存储网络CNN长短期记忆网络诊断LSTM模型的过拟合和过拟合如何使用长短期记忆模型做出预测LSTM时间序列

LSTM对时间序列预测的适用性长短期记忆网络的时间序列预测长短期记忆网络的多步时间序列预测Keras中使用LSTM进行的多元时间序列预测自然语言处理深度学习（NLP）

由于自然语言的混乱性质，因此很难处理文本数据。

文本不是“已解决”的，而是要获得有关具有挑战性的NLP问题的最新结果，您需要采用深度学习方法

这是开始进行自然语言处理的深度学习的方法：

步骤1：了解NLP的深度学习的意义。什么是自然语言处理？什么是深度学习？深度学习对自然语言处理的承诺第2步：发现NLP的标准数据集。7深度学习在自然语言处理中的应用自然语言处理数据集步骤3：发现如何解决问题并交付结果。深度学习中的自然语言处理速成课程用于自然语言处理的深度学习（我的书）

转载请注明：http://www.0431gb208.com/sjslczl/4011.html

上一篇文章：网易伏羲人工智能实验室李仁杰AI可以让游

下一篇文章：如何提升代码搜索效果GitHub团队打造