手搓大模型之only em for pos之增加依赖性

这篇具有很好参考价值的文章主要介绍了手搓大模型之only em for pos之增加依赖性。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

import paddle


class EmAdd(paddle.nn.Layer):
    def __init__(self, voc_size=9999, hidden_size=256):
        super(EmAdd, self).__init__()
        self.hidden_size = hidden_size
        p = 0
        while True:
            voc_size //= hidden_size
            if voc_size == 0:
                break
            else:
                p += 1
        self.em = paddle.nn.LayerList([paddle.nn.Embedding(hidden_size, hidden_size) for _ in range(p + 1)])
        # self.em_zero = paddle.nn.LayerList([paddle.nn.Embedding(hidden_size, hidden_size,padding_idx=0)
        # for _ in range(p + 1)])

    def forward(self, em_add_x):

        add = 0
        p = len(self.em) + 1
        mask = paddle.zeros(em_add_x.shape)
        for i, em in enumerate(self.em):
            # mask 是累加不等于0
            i += 1
            x0 = em_add_x % self.hidden_size ** (p - i) // self.hidden_size ** ((p - i) - 1)
         

文章来源地址https://www.toymoban.com/news/detail-676077.html

到了这里,关于手搓大模型之only em for pos之增加依赖性的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 生成模型相关算法:EM算法步骤和公式推导

    EM 算法是一种选代算法,1977 年 Dempster 等人总结提出,用于含有隐变量(hidden variable)的概率模型参数的极大似然估计,或极大后验概率估计EM算法的每次选代由两步组成:E步,求期望 (expectation);M步,求极大(maximization)所以这一算法称为期望极大算法(expectation maximizationalgorithm),

    2024年02月14日
    浏览(39)
  • 高斯混合模型(GMM)及EM算法---MATLAB程序

            大家喜欢的话记得关注、点赞、收藏哦~         高斯混合模型(Gaussian Mixed Model,GMM) 是由多个高斯分布函数组成的线性组合。理论上,GMM可以拟合出任意类型的分布,通常用于解决同一集合下的数据包含多个不同分布的情况。---转自:http://t.csdn.cn/SPEcN      

    2024年02月11日
    浏览(42)
  • 实现 Table 的增加和删除,不依赖后端数据回显

    删除前 删除后 首先写一个 Table 我们可以对数组进行操作,首先是增加操作 删除指定元素

    2024年04月16日
    浏览(23)
  • 高斯分布、高斯混合模型、EM算法详细介绍及其原理详解

    K近邻算法和KD树详细介绍及其原理详解 朴素贝叶斯算法和拉普拉斯平滑详细介绍及其原理详解 决策树算法和CART决策树算法详细介绍及其原理详解 线性回归算法和逻辑斯谛回归算法详细介绍及其原理详解 硬间隔支持向量机算法、软间隔支持向量机算法、非线性支持向量机算

    2024年02月06日
    浏览(76)
  • eclipse中在maven工程 的pom.xml文件中增加依赖的方法

    方法1:直接编辑pom.xml文件增加依赖 直接编辑pom.xml文件肯定是可以了,不管是否在eclipse中,挺方便的。 例如,从maven仓库中找到自己需要依赖的插件,里边已经将依赖的配置代码写好了,直接拷贝到maven工程的pom.xml文件对应位置即可,也很方便: 方法2:利用eclipse的图形化

    2024年02月13日
    浏览(48)
  • Original error: gsmCall method is only available for emulators

    在夜神模拟器执行报错 意思是gsmCall这个命令不支持,只支持下面这些命令 selenium.common.exceptions.UnknownMethodException: Message: Unknown mobile command \\\"gsmCall\\\". Only shell,execEmuConsoleCommand,dragGesture,flingGesture,doubleClickGesture,longClickGesture,pinchCloseGesture,pinchOpenGesture,swipeGesture,scrollGesture,scrollBackT

    2024年02月14日
    浏览(42)
  • EM算法实现之隐马尔科夫模型HMM的python实现

    1 基本概念 1.1 马尔科夫链(维基百科) 马尔可夫链(英语:Markov chain),又称离散时间马尔可夫链(discrete-time Markov chain,缩写为DTMC),因俄国数学家安德烈·马尔可夫得名,为状态空间中经过从一个状态到另一个状态的转换的随机过程。该过程要求具备“无记忆”的性质:

    2024年02月09日
    浏览(46)
  • Python Wordcloud报错:Only supported for TrueType fonts,多种解决方案

    Python Wordcloud报错:Only supported for TrueType fonts,多种解决方案。 报错内容如下: 2023-10-26T09:35:41.190459839Z Traceback (most recent call last): 2023-10-26T09:35:41.190502589Z File “lib/task/compute.py”, line 621, in 2023-10-26T09:35:41.190514101Z compute_match_rule(rule_data) 2023-10-26T09:35:41.190521681Z File “lib/task/comp

    2024年02月07日
    浏览(47)
  • 深入篇【C++】手搓模拟实现二叉搜索树(递归/非递归版本)&&常见应用场景(K模型与KV模型)

    二叉搜索树又称二叉排序树,它或者是一颗空树或者是具有以下性质的二叉树: 1.当它的左子树不为空,则左子树上所有的结点的值都要小于根节点。 2.当它的右子树不为空,则右子树上所有的结点的值都要大于根结点。 3.它的左右子树都是二叉搜索树。 ①.定义结点 二叉树

    2024年02月12日
    浏览(42)
  • Python word cloud库试用时出现Only supported for TrueType fonts错误

    在下载wordcloud库之前,需要下载几个前置库,其中包括一个pillow图像处理库,即我们常常熟知的PIL库,出现这种报错,首先可查看 利用该命令行可查看是否支持truetype格式,  freetype形式既是,一般情况下都会支持,但由于如果你的wordcloud库和pil库不是同时下载会导致部分版

    2024年02月11日
    浏览(39)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包