GLM(Generalized Linear Models)模型详解

这篇具有很好参考价值的文章主要介绍了GLM(Generalized Linear Models)模型详解。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Generalized Linear Models广义线性模型

指数家族(The exponential family)

指数家族是指一类概率分布,其具有指数模式。需要注意,这是一类概率分布,不是特指某个概率分布,因此指数分布只有固定的格式,根据参数不同,会生成不同的分布。

指数家族分布定义

若一个随机变量y的分布被称为指数家族分布,那么其需要满足:
GLM(Generalized Linear Models)模型详解
由以上可看出,p(y)是被η参数化的,所以随着η的不同,就会生出不同的分布。

指数家族分布例子一——伯努利分布

我们可以对伯努利分布进行变化,具体如下:
GLM(Generalized Linear Models)模型详解
由以上可看出,上面的变换后的结果,符合指数家族的定义,其中η = log(φ/(1 − φ))

指数家族分布例子二——高斯分布

以均值为µ,方差为1的高斯分布为例(注意,在线性回归模型中我们已经推导,方差对于最终的θ及h(θ)无影响,所以这里简化推导过程,把方差设为1)
GLM(Generalized Linear Models)模型详解
由此可见,η = µ

指数家族分布其他例子

还有泊松分布,指数分布等也为指数家族分布的其他例子,不在此做推导了

使用GLM构造机器学习模型

利用GLM来构建机器学习模型的步骤及前提

假设P1:假定y | x; θ ∼ ExponentialFamily(η).
假设P2:给定训练集x,我们的目标是预测E[T(y)](注:T(y)一般等于y),即我们要使h(x) = E[y|x]
假设P3:指定η = θ^Tx,即η与x为线性关系(本条可视为基于经验的最佳设计选择)
按照上方1-3步骤,可逐步构建相应的GLM机器学习模型。

利用GLM来构建机器学习模型的示例一——线性回归模型

基于本文上方推导,我们知道高斯分布属于指数家族,且满足η = µ。所以:
STEP1:根据假设P1,我们假定某一目标值y服从于正态分布(具体假定服从于什么分布需要看y的实际意义,若y>0,则用泊松分布等可能更合适~),即
y~N (µ,σ^2)
STEP2:根据假设P2,我们有:
hθ(x) = E[y|x; θ] = µ = η = θ^T x.
STEP3:由此,我们构建出一个线性机器学习模型,如下:
y=hθ(x)=θ^T x

利用GLM来构建机器学习模型的示例二——逻辑斯蒂回归模型

逻辑斯蒂回归适用于伯努利概率分布,因为目标y仅有两种取值0或1。
基于本文上方推导,我们知道伯努利概率分布也属于指数家族,且满足φ = 1/(1 + e
^(−η))。所以:
STEP1:根据假设P1,我们假定某一目标值y服从于伯努利分布,即
y|x; θ ∼ Bernoulli(φ)
STEP2:根据假设P2,我们有:
GLM(Generalized Linear Models)模型详解
STEP3:由此,我们构建出一个线性机器学习模型,如下:
y=hθ(x)= 1/(1 + e^ (−θ^T x))

利用GLM来构建机器学习模型的示例三——Softmax 回归模型

假定目标集可取值为k元,即y∈{1,2,…,k},则y属于多元分布,现在根据构造GLM的步骤,构造Softmax回归模型
STEP1:假设y的每种取值的概率为φ1,…,φk(需要注意这些概率值之间不相互独立,因为概率的归一性,有φk=1-(φ1+…+φk-1))
STEP2:下面我们来构造T(y),定义如下:
GLM(Generalized Linear Models)模型详解
(注意这里的T(y)为n-1维向量)
STEP3:定义一个函数1{·} ,其含义为1{True} = 1, 1{False} = 0。我们用(T(y))i代表T(y)的第i个元素(i∈{1,2,…,k-1}),则有:
E[(T(y))i] =P(Y=y)(T(y))i= φi(注意T(y)i=0 if y≠i)
STEP4:证明多元分布为指数家族分布,即符合假设一:
GLM(Generalized Linear Models)模型详解
其中
GLM(Generalized Linear Models)模型详解
由以上可观察得:GLM(Generalized Linear Models)模型详解
GLM(Generalized Linear Models)模型详解
进一步推导,有:
GLM(Generalized Linear Models)模型详解
以上公式即为softmax function。
STEP5:根据假设3,我们有ηi = (θi^T)x (for i = 1, . . . , k − 1),即线性相关。
由此,我们有:
GLM(Generalized Linear Models)模型详解
再根据假设二,我们有:
GLM(Generalized Linear Models)模型详解
以上过程即为softmax回归

使用softmax回归

那么针对m组训练集,如何使用softmax回归获得具体的参数呢?我们有构造最大似然函数:
GLM(Generalized Linear Models)模型详解
之后可用梯度下降等方法,来最大化l(θ),求出对应的θ文章来源地址https://www.toymoban.com/news/detail-469330.html

到了这里,关于GLM(Generalized Linear Models)模型详解的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 对标ChatGPT生态: 智谱全新大模型 GLM-4 发布

    🍁 展望:关注我, AI 和 编程 学习之旅上,我与您一同成长! 今天上午,在北京举办 2024年度技术开放日 Zhipu DevDay,国内当前估值最高的AI大模型独角兽智谱AI发布了 新一代基座大模型GLM-4 。 性能比上一代提升接近60%,整体评测结果进阶GPT-4,支持更长的上下文、更强的多模

    2024年01月17日
    浏览(50)
  • torch.nn.Linear详解

    在学习transformer时,遇到过非常频繁的nn.Linear()函数,这里对nn.Linear进行一个详解。 参考:https://pytorch.org/docs/stable/_modules/torch/nn/modules/linear.html 从名称就可以看出来,nn.Linear表示的是线性变换,原型就是初级数学里学到的线性函数: y=kx+b 不过在深度学习中,变量都是多维张

    2023年04月09日
    浏览(26)
  • GPT与R语言回归模型(lm&glm)、混合效应模型、多元统计分析

    自2022年GPT(Generative Pre-trained Transformer)大语言模型的发布以来,它以其卓越的自然语言处理能力和广泛的应用潜力,在学术界和工业界掀起了一场革命。在短短一年多的时间里,GPT已经在多个领域展现出其独特的价值,特别是在数据统计分析领域。GPT的介入为数据处理、模

    2024年04月10日
    浏览(30)
  • 【LLM系列之底座模型对比】LLaMA、Palm、GLM、BLOOM、GPT模型结构对比

    LLama [GPT3] 使用RMSNorm(即Root Mean square Layer Normalization)对输入数据进行标准化,RMSNorm可以参考论文:Root mean square layer normalization。 [PaLM]使用激活函数SwiGLU, 该函数可以参考PALM论文:Glu variants improve transformer。 [GPTNeo]使用Rotary Embeddings进行位置编码,该编码可以参考论文 Rofo

    2024年02月09日
    浏览(38)
  • GLM-130B-一个开放的双语通用预训练模型-论文精读

    本文为作为类ChatGPT的模型ChatGLM的前期基础论文2《AN OPEN BILINGUAL PRE-TRAINED MODEL》的精读笔记,基础论文1的精读笔记请见《GLM论文精读-自回归填空的通用语言模型》。希望对大家有帮助,欢迎讨论交流。GLM-130B,主要思想概述:一个双语(英文和中文)的基于GLM的双向稠密模型

    2024年02月12日
    浏览(44)
  • AI大模型探索之路-应用篇17:GLM大模型-大数据自助查询平台架构实践

    在众多大型企业中,数据资产庞大无比,因此它们纷纷构建了多种大数据平台。然而,关键在于如何高效地利用这些数据,例如,将数据有效地提供给产品经理或数据分析师以供他们进行设计和分析。在传统工作流程中,由于这些角色通常不是技术专家,他们往往无法直接使

    2024年04月22日
    浏览(72)
  • AI大模型探索之路-应用篇16:GLM大模型-ChatGLM3 API开发实践

    目录 一、ChatGLM3-6B模型API调用 1. 导入相关的库 2. 加载tokenizer 3. 加载预训练模型 4. 实例化模型 5.调用模型并获取结果 二、OpenAI风格的代码调用 1. Openai api 启动 2. 使用curl命令测试返回 3. 使用Python发送POST请求测试返回 4. 采用GLM提供的chat对话方式 5. Embedding处理 三、Functio

    2024年04月23日
    浏览(32)
  • AI大模型探索之路-实战篇3:基于私有模型GLM-企业级知识库开发实战

    在当今信息时代,数据已经成为企业的核心资产之一。对于许多企业而言,信息安全和私密性是至关重要的,因此对外部服务提供的数据接口存在天然的警惕性。因此常规的基于在线大模型接口落地企业知识库项目,很难满足这些企业的安全需求。面对这样的挑战,只有私有

    2024年04月23日
    浏览(44)
  • 智谱AI技术开放日:新一代基座大模型GLM-4及GLMs的发布

    2024年1月16日,智谱AI举行了一次重要的技术开放日,发布了新一代基座大模型GLM-4和定制化的大模型GLMs。此次发布标志着智谱AI在人工智能领域的新一轮突破,进一步提升了大模型的性能,并降低了使用门槛,使得更多的人能够参与到AI的广泛应用中来。 GLM-4模型是智谱AI全自

    2024年01月16日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包