当前位置: 首页 > news >正文

泰安网站销售公司创建一个自己的公司的英文

泰安网站销售公司,创建一个自己的公司的英文,wordpress 一些数据表不可用,开发安卓应用目录 逻辑函数(Logistic Function) 逻辑回归模型的假设函数 从逻辑回归模型转换到最大似然函数过程 最大似然函数方法 梯度下降 逻辑函数(Logistic Function) 首先,逻辑函数,也称为Sigmoid函数&#…

目录

逻辑函数(Logistic Function)

逻辑回归模型的假设函数

从逻辑回归模型转换到最大似然函数过程

最大似然函数方法

梯度下降


逻辑函数(Logistic Function)

首先,逻辑函数,也称为Sigmoid函数,是一个常见的S形函数。其数学表达式为:

g(z)=\frac1{1+e^{-z}}

这个函数的特点是,其输出值总是在0和1之间。这个性质使得Sigmoid函数非常适合用来进行二分类,在机器学习中,它可以将任意实数映射到(0, 1)区间,用来表示某个事件发生的概率。例如,在逻辑回归模型中,我们可以用它来预测一个实例属于某个类别的概率。

def sigmoid(z):return 1 / (1 + np.exp(-z))

可视化:

nums = np.arange(-10, 10, step=1)fig, ax = plt.subplots(figsize=(12,8))
ax.plot(nums, sigmoid(nums), 'r')
plt.show()

逻辑回归模型的假设函数

逻辑回归模型的假设函数将输入特征X和参数θ的线性组合通过逻辑函数转换为一个概率值,其公式为:

h_\theta(x)=\frac1{1+e^{-\theta^TX}}

这里,θ^T X是参数θ和输入特征X的点积,它将多个输入特征线性组合成一个实数值,然后通过逻辑函数映射到(0, 1)区间。这个映射的结果可以被解释为在给定输入特征X的条件下,预测结果为正类的概率。

逻辑回归模型通过优化参数θ来最大化观测数据的似然函数,从而找到最佳的决策边界,以区分不同的类别。在实际应用中,逻辑回归是一个非常强大且广泛使用的分类算法,特别是在二分类问题中。 

从逻辑回归模型转换到最大似然函数过程

逻辑回归模型的假设函数定义为:

h_\theta(x)=g(\theta^Tx)=\frac{1}{1+e^{-\theta^Tx}}

为了找到最佳的参数θ,我们使用最大似然估计。对于二分类问题,给定的数据集D=\{(x^{(i)},y^{(i)})\}_{i=1}^{m},其中y^{(i)}\in\{0,1\},,我们可以写出似然函数:

L(\theta)=P(y|X;\theta)=\prod_{i=1}^m(h_\theta(x^{(i)}))^{y^{(i)}}(1-h_\theta(x^{(i)}))^{1-y^{(i)}}

这个似然函数表示了,在给定参数θ和输入X的条件下,观察到当前数据集y的概率。最大化这个似然函数等价于最大化观测数据在当前模型参数下出现的概率。

为了便于计算,通常对似然函数取对数,得到对数似然函数:

\log L(\theta)=\sum_{i=1}^m[y^{(i)}\log h_\theta(x^{(i)})+(1-y^{(i)})\log(1-h_\theta(x^{(i)}))]

 最大化对数似然函数相对简单,因为对数函数是单调的,且对数似然函数是关于θ的凸函数,容易通过梯度下降等优化算法找到全局最优解。

在机器学习中,我们通常通过最小化损失函数(而不是最大化似然函数)来训练模型。因此,我们将最大化对数似然问题转化为最小化损失函数问题。损失函数是对数似然函数的负值,平均化到每个样本上,即:

这就是逻辑回归中使用的损失函数,也称为对数损失或交叉熵损失。通过最小化这个损失函数,我们可以找到最佳的模型参数θ,使模型对训练数据的拟合程度最高,即最可能产生观测数据的参数。 

最大似然函数方法

由于乘除法不太好优化计算,通常通过对数的方法进行优化求解,损失函数如下:

\begin{aligned}J(\theta)=-\frac{1}{m}\sum_{i=1}^{m}[y^{(i)}\log(h_{\theta}(x^{(i)}))+(1-y^{(i)})\log(1-h_{\theta}(x^{(i)}))]\end{aligned}

def cost(theta, X, y):theta = np.matrix(theta)X = np.matrix(X)y = np.matrix(y)first = np.multiply(-y, np.log(sigmoid(X * theta.T)))second = np.multiply((1 - y), np.log(1 - sigmoid(X * theta.T)))return np.sum(first - second) / (len(X))

梯度下降

实际上这里只计算量梯度,并没有下降

def gradient(theta, X, y):theta = np.matrix(theta)X = np.matrix(X)y = np.matrix(y)parameters = int(theta.ravel().shape[1])grad = np.zeros(parameters)error = sigmoid(X * theta.T) - yfor i in range(parameters):term = np.multiply(error, X[:,i])grad[i] = np.sum(term) / len(X)return grad

http://www.yayakq.cn/news/188697/

相关文章:

  • 网站常用插件网页游戏代理加盟
  • 蒙文网站建设情况汇报材料办公网络建设项目商务要求
  • 益阳网站制作公司地址建设网站的服务费是指什么意思
  • 如何做一个自己的网站华为网络工程师认证
  • 电影网站建设需要什么软件做原型的素材网站
  • 襄阳网站建设feeyr创办网站
  • 网站下载app免费深圳建设网站商
  • 网络建站流程iis 怎么绑定网站二级目录
  • 网站建设公司盈利模式浙江融兴建设有限公司网站
  • 设计专业知名企业网站高端自适应网站设计
  • 网站上传的流程聊城高端网站制作
  • 关闭未备案网站手机网站和电脑网站一样吗
  • 公司注册法人查询seo网站做推广公司
  • 网站工作建设站电话制作一个在线收费网站
  • 网站开发的前端到底是什么做群头像的网站在线制作
  • 中文博客网站模板上海网页设计师培训班
  • 做哪个网站的推广最好网站建设流程有几个阶段
  • 重庆品牌型网站建设多少钱视觉设计是什么
  • 网站后台发文章图片链接怎么做推荐 南昌网站建设
  • 长春火车站人工电话wordpress神箭手
  • 做网站要写多少行代码网站备案没通过不了
  • 做内衣的网站域名绑定网站需要多久
  • 易语言怎么做网页网站百度权重查询入口
  • 企业网站模板htmlWordPress留下评论
  • 村建站属于哪个部门windows优化大师提供的
  • 农村建设有限公司网站企业网网页
  • 海南四定网站开发网站建设多久学会
  • 中国建设银行网站太慢了点子网创意网
  • 网站标题能改吗有没有网址
  • 曲靖网站制作一条龙网站建设渠道合作