Logistic Regression In Python 简明教程

Logistic Regression in Python - Introduction

逻辑回归是一种用于对对象进行分类的统计方法。本章将借助一些示例介绍逻辑回归。

Classification

要理解逻辑回归,您应该知道分类的含义。让我们考虑以下示例以更好地理解这一点 −

  1. 医生将肿瘤分类为恶性或良性。

  2. 银行交易可能是欺诈性的或真实的。

多年来,人类一直在执行此类任务——尽管它们容易出错。问题是我们能否训练机器以更高的准确性为我们执行这些任务?

机器执行分类的一个示例是您机器上的电子邮件 Client 程序,它将每封传入邮件归类为“垃圾邮件”或“非垃圾邮件”,并且它的准确性相当高。逻辑回归的统计技术已成功应用于电子邮件客户端。在这种情况下,我们已经训练我们的机器来解决分类问题。

逻辑回归只是用于解决此类二元分类问题的机器学习的一个部分。还有其他几种机器学习技术已经开发出来并用于解决其他类型的问题。

如果您已经注意到,在以上所有示例中,预测的结果只有两个值——是或否。我们称之为类别——所以我们说我们的分类器将对象分类为两个类别。从技术角度讲,我们可以说结果或目标变量本质上是二分的。

在其他分类问题中,输出可能被分类成多于两个的类别。例如,给定一篮子水果,要求你将不同种类的水果分拣出来。现在,篮子可能装着橘子、苹果、芒果,等等。所以当你分拣水果时,你要将它们分拣成两类以上。这是多变量分类问题。