什么是监督式学习?

来源 | 谷歌

监督式学习是机器学习的一个类别,使用带标签的数据集来训练算法,以预测结果和识别模式。与非监督式学习不同,监督式学习算法会获得带标签的训练,以学习输入和输出之间的关系。

利用监督式机器学习算法,组织可以更轻松地创建能够进行准确预测的复杂模型。因此,它们广泛应用于各个行业和领域,包括医疗保健、营销、金融服务等。

在这里,我们将介绍 AI 中的监督式学习的基础知识、监督式学习算法的工作原理,以及它的一些最常见的应用场景。

监督式学习的工作原理是什么?

监督式学习中使用的数据是带标签的,这意味着其中的样本包含输入(称为特征)和正确输出(标签)。算法会分析包含这些训练对的大型数据集,以便在被要求根据新数据进行预测时,推断出正确的输出值。

例如,假设您想要训练一个模型来识别树木图片。您需要提供一个带标签的数据集,其中包含许多不同的树种和每个树种名称的样本。您可以让算法尝试根据带标签的输出来定义每种树的特征集。然后,您可以向模型展示一张树的图片,要求它推测树的种类,以此对模型进行测试。如果模型给出错误答案,您可以继续进行训练并使用更多样本来调整模型参数,以提高模型的准确率并最大限度地减少错误。

模型完成训练并通过测试后,您便可以让它根据先前学习的知识对未知数据进行预测。

监督式学习的类型

机器学习中的监督式学习通常分为两类:分类和回归。

分类

分类算法根据输入数据预测分类标签或输出变量,用于对数据进行分组。当输出变量是分类(即存在两个或更多个类别)时使用分类算法。

分类算法最常见的应用之一是电子邮件收件箱中的垃圾邮件过滤器。监督式学习模型使用包含垃圾邮件和正常邮件有标签样本的数据集进行训练,用于预测一封电子邮件是否为垃圾邮件。算法会提取每封电子邮件的信息,包括发件人、主题行和正文等。然后,它会使用这些特征和相应的输出标签来学习模式,并分配一个分数来指示电子邮件是真实邮件还是垃圾邮件。

回归

回归算法检测两个或多个变量之间的关系,以预测实值或连续值。

回归任务的一个常见示例是根据工作经验预测薪资。例如,向监督式学习算法输入与工作经验相关的数据(例如时长、行业或领域、地点等)和分配的相应薪资金额。模型经过训练后,便可用于根据工作经验预测平均薪资。

现实世界监督式学习示例

监督式学习模型可应用于许多不同的业务用例,帮助解决各类问题。常见的监督式学习示例包括:

  • 风险评估:监督式机器学习模型可以帮助银行和其他金融服务公司确定客户是否有贷款违约风险,进而最大限度地降低其投资组合的风险。
  • 图片分类:监督式机器学习算法经常经过训练用于对图片和视频中的对象进行分类。例如,我们可以使用某种算法来识别图片中的人,并在社交媒体平台上自动为他们添加标签。
  • 欺诈检测:监督式学习为许多欺诈检测系统提供底层支持,使企业能够识别欺诈活动。这些模型基于包含欺诈和非欺诈活动的数据集进行训练,因此可用于实时警示可疑活动。
  • 推荐系统:在线平台和在线媒体服务使用监督式学习算法,根据客户过往的行为或购物记录推荐内容。这些模型会提取有关用户行为的重要信息,并推荐类似的产品和内容。

监督式学习与非监督式学习

监督式学习与非监督式学习的主要区别是用于训练模型的输入数据类型。监督式学习使用带标签的训练数据集来训练模型,使其学习特定的预定义目标。

相比之下,非监督式学习使用无标签数据,在没有明确指示的情况下自主尝试和学习数据的结构。

版权声明及安全提醒:本文转自网络平台,文章仅代表作者观点,不代表「金融文库」立场。相关版权归原作者所有,「金融文库」仅提供免费交流与学习,相关内容与材料请勿用于商业。我们感谢每一位原创作者的辛苦付出与创作,如本转载内容涉及版权及侵权问题,请及时联系我们客服处理(微信号:RyanLin007),谢谢!

(0)
上一篇 2025年6月1日 上午12:51
下一篇 2025年6月1日 上午12:28

相关推荐