逻辑回归基础教程文档

收录于 2023-04-20 00:10:05 · بالعربية · English · Español · हिंदीName · 日本語 · Русский язык · 中文繁體

逻辑回归简介

逻辑回归是一种有监督的学习分类算法,用于预测目标变量的概率。目标或因变量的性质是二分法的,这意味着将只有两个可能的类。
简单来说,因变量本质上是二进制的,其数据编码为1(代表成功/是)或0(代表失败/否)。
在数学上,逻辑回归模型预测P(Y = 1)作为X的函数。它是最简单的ML算法之一,可用于各种分类问题,例如垃圾邮件检测,糖尿病预测,癌症检测等。

逻辑回归的类型

通常,逻辑回归是指具有二进制目标变量的二进制逻辑回归,但是可以通过它预测两类以上的目标变量。基于这些类别的数量,逻辑回归可以分为以下类型-

二元或二项式

在这种分类中,因变量将只有两种可能的类型,即1和0。例如,这些变量可以表示成功或失败,是或否,赢或输等。

多项式

在这种分类中,因变量可以具有3种或更多可能的 无序 类型或无定量意义的类型。例如,这些变量可以表示"类型A"或"类型B"或"类型C"。

序号

在这种分类中,因变量可以具有3种或更多可能的 有序 类型或具有定量意义的类型。例如,这些变量可以表示"差"或"好","非常好","优秀",并且每个类别的得分都可以为0、1、2、3。

逻辑回归假设

在深入研究逻辑回归的实现之前,我们必须了解以下关于相同的假设-
对于二进制逻辑回归,目标变量必须始终为二进制,并且期望结果由因子级别1表示。 模型中不应存在任何多重共线性,这意味着自变量必须彼此独立。 我们必须在模型中包括有意义的变量。 我们应该选择大样本量进行逻辑回归。

回归模型

二进制Logistic回归模型-Logistic回归的最简单形式是二进制或二项式Logistic回归,其中目标或因变量只能具有两种可能的类型1或0。 多项Logistic回归模型-Logistic回归的另一种有用形式是多项Logistic回归,其中目标或因变量可以具有3个或更多可能的 无序 类型,即没有定量意义的类型。