机器学习之逻辑回归

佚名 5年前 (2019-07-16) 人工智能 1142人围观抢沙发百度已收录

一句话：逻辑回归假设数据服从伯努利分布，通过极大化似然函数的方法，运用梯度下降求解参数，来达到将数据二分类的目的。

假设函数

逻辑回归算法是将线性函数的结果映射到 sigmoid 函数中：

SRE实战互联网时代守护先锋，助力企业售后服务体系运筹帷幄！一键直达领取阿里云限量特价优惠。

\[ h_{\theta}{(x)}=\frac{1}{1+e^{-z}}=\frac{1}{1+e^{\theta^{T}x}} \]

函数的形式如下：

因此对于输入 x 分类结果为类别 1 和类别 0 的概率分别为：

\[ \begin{align} P(y=1|x;\theta)&=h_{\theta}{(x)}\\ P(y=0|x;\theta)&=1-h_{\theta}(x) \end{align} \]

极大似然估计

利用极大似然估计的方法求解损失函数，首先得到概率函数为：

\[ P(y|x;\theta)=(h_{\theta}(x))^y*(1-h_{\theta}{(x)})^{1-y} \]
因为样本数据互相独立，所以它们的联合分布可以表示为各边际分布的乘积，取似然函数为：

\[ \begin{align} L(\theta)&=\prod_{i=1}^{m}{P(y^{(i)}|x^{(i)};\theta)}\\ &=\prod_{i=1}^{m}{(h_{\theta}(x^{(i)}))^{y^{(i)}}*(1-h_{\theta}(x^{(i)}))^{1-y^{(i)}})} \end{align} \]
取对数似然函数：

\[ l(\theta)=\log(L(\theta))=\sum_{i=1}^{m}{(y^{(i)}\log{(h_{\theta}(x^{(i)}))}+(1-y^{(i)})\log({1-h_{\theta}{(x^{(i)})}}))} \]
最大似然估计就是要求得使 \(l(\theta)\) 取最大值时的 \(\theta\) ，为了应用梯度下降法。我们稍微变换一下：

\[ J(\theta)=-\frac{1}{m}l(\theta) \]