MongoDB聚合操作符:$accumulator

这篇具有很好参考价值的文章主要介绍了MongoDB聚合操作符:$accumulator。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

$accumulator可以定义自定义累加器操作符。累加器是一种操作符,可在文档通过管道时保持其状态(如:总数、最大值、最小值和相关数据)。$accumulator操作符支持执行自定义的JavaScript函数,可以实现MongoDB查询语言不支持的行为。

$accumulator支持下列阶段:

  • $bucket
  • $bucketAuto
  • $group

**注意:**在聚合操作符内部执行JavaScript可能会降低性能,只有在MongoDB提供的管道操作符无法满足需求时才考虑使用$accumulator

语法

{
  $accumulator: {
    init: <code>,
    initArgs: <array expression>,        // 可选
    accumulate: <code>,
    accumulateArgs: <array expression>,
    merge: <code>,
    finalize: <code>,                    // 可选
    lang: <string>
  }
}

字段说明:

  • init
    字符串或代码,用于初始化状态的函数。init函数从initArgs数组接受参数,可以使用BSON类型代码或字符串来定义函数,init函数形式如下:

      function (<initArg1>, <initArg2>, ...) {
          ...
          return <initialState>
      }
    

    **注意:**溢出到磁盘或在分片集群上运行查询会导致累加器以多个子累加器合并的形式计算,每个函数都以调用init()开始。要确保init()accumulative()merge()函数与此执行模式兼容。

  • initArgs
    数组,可选,传递给init函数的参数。initArgs为下面的形式:

    [ <initArg1>, <initArg2>, ... ]
    

    **注意:**应用于$bucketAuto阶段时,initArgs不能应用分组键(也就是说不能使用$<fieldName>语法),换而言之,在$bucketAuto阶段,只能给initArgs指定常量。

  • accumulate
    字符串或代码,用于文档累加的函数,accumulate函数从accumulateArgs数组表达式接受当前状态和参数,accumulate函数的返回值变为新状态,函数定义可以为BSON类型的代码或字符串。accumulate函数的形式如下:

    function(state, <accumArg1>, <accumArg2>, ...) {
      ...
      return <newState>
    }
    
  • accumulateArgs
    传递给accumulate函数的参数,可以使用accumulateArgs来制定传递给accmulate函数的字段值。accumulateArgs的形式如下;

    [ <accumArg1>, <accumArg2>, ... ]
    
  • merge
    字符串或代码,用于合并两个内部状态的函数,merge必须是字符串或BSON代码类型,merge返回两个状态合并后的结果,mere函数的形式如下:

    function (<state1>, <state2>) {
      <logic to merge state1 and state2>
      return <newState>
    }
    
  • finalize
    字符串或代码,可选,用于更新累加结果的函数。finalize函数的形式如下:

    function (state) {
      ...
      return <finalState>
    }
    
    
  • lang
    字符串类型,accumulator代码使用的语言。目前仅支持js

使用

下面是$accumulator操作符处理文档的过程和步骤:

  1. 操作符从初始状态开始,由init函数定义。
  2. 操作符基于accumulate指定的函数更新每个文档的状态。
  3. 当操作符需要合并多个中间状态时,会执行merge函数。
  4. 如果定义了finalize函数,一旦所有文档被处理完并且状态因此更新,最终确定将状态到最终输出。

使用$merge合并两个状态

作为其内部运作的一部分,累加器操作符可能需要合并两个独立的中间状态。合并函数指定操作符应如何合并两个状态。

例如,下面的情况下,$accumulator可能需要合并两个状态:

  • $accumulator运行在分片集群上,操作符需要合并每个分片的结果,以得到的最终结果。
  • 单个$accumulator操作超出了它指定的内存限制,如果指定了alloDiskUse选项,操作符将正在进行的操作放在磁盘上并在内存中完成操作。一旦操作完成,磁盘上、内存中的的结果将由merge函数进行合并。

**注意:**合并函数总是一次合并两个状态。当有两个以上状态需要合并时,则会先合并两个状态为一个状态,然后重复这一过程,直到所有的状态都被合并。也就是说每次合并只能合并两个状态。

内嵌javascript

要使用$accumulator,必须启用服务端脚本选项。如果不使用$accumulator(或$function$where、或mapRecuce),可以禁用服务端脚本:

  • 对于mongod实例,可以参考security.javascriptEnabled选项配置或--noscripting命令行选项。
  • 对于mongos实例,可以参考security.javascriptEnabled选项配置或--noscripting命令行选项(从MongoDB4.4开始)。
    对于更早的版本,MongoDB不允许在mongos实例上执行JavaScript。

不支持的数组和字符串函数

MongoDB6.0升级了用于服务端JavaScript的内部JavaScript引擎,包括$accumulator$function$where表达式,从MozJS-60升级到了MozJS-91MozJS-60中存在的一些不推荐使用的非标准数组和字符串函数在MozJS-91中被删除。

举例

用$accumulator实现$avg操作符

**注意:**本例使用$accumulator实现的$avg在MongoDB中已经支持,本例的目的不是去实现一个新功能,而是演示accumulator操作符常见逻辑的行为和语法。

mongosh,使用下面的文档创建一个books集合:

db.books.insertMany([
  { "_id" : 8751, "title" : "The Banquet", "author" : "Dante", "copies" : 2 },
  { "_id" : 8752, "title" : "Divine Comedy", "author" : "Dante", "copies" : 1 },
  { "_id" : 8645, "title" : "Eclogues", "author" : "Dante", "copies" : 2 },
  { "_id" : 7000, "title" : "The Odyssey", "author" : "Homer", "copies" : 10 },
  { "_id" : 7020, "title" : "Iliad", "author" : "Homer", "copies" : 10 }
])

下面的操作使用author对文档进行分组,并使用$accumulator计算每个作者书籍的平均拷贝数。

db.books.aggregate([
{
  $group :
  {
    _id : "$author",
    avgCopies:
    {
      $accumulator:
      {
        init: function() {                        // 设置初始状态
          return { count: 0, sum: 0 }
        },

        accumulate: function(state, numCopies) {  // 定义如何更新状态
          return {
            count: state.count + 1,
            sum: state.sum + numCopies
          }
        },

        accumulateArgs: ["$copies"],              // accumulate函数需要的参数

        merge: function(state1, state2) {         // 当操作符执行合并
          return {                                // 两个状态加到字段
            count: state1.count + state2.count,
            sum: state1.sum + state2.sum
          }
        },

        finalize: function(state) {               // 收集所有文档的结果后
          return (state.sum / state.count)        // 计算平均值
        },
        lang: "js"
      }
    }
  }
}
])
结果

操作返回下面的结果:

{ "_id" : "Dante", "avgCopies" : 1.6666666666666667 }
{ "_id" : "Homer", "avgCopies" : 10 }
过程分析

$accumulator定义了一个初始状态,其中countsum都设置为0$accumulator对每个文档使用以下方式更新状态:

  • count每次加1
  • 将文档copies字段的值加到sum,通过accumulateArgs指定的参数,累加器函数可以访问copies字段。

当所有的文档都被处理完后,accumulate函数返回更新后的状态。

一旦所有的文档被处理完,finilize函数使用拷贝的sum值除以文档数量count得到平均值。这样就不需要保持运行计算后的平均值,因为finilize函数会接收到sumcount的累计值。

对比$avg

下面的操作使用了$avg操作符,与上面的方法是等价的:

db.books.aggregate([
{
  $group : {
    _id : "$author",
    avgCopies: { $avg: "$copies" }
  }
}
])

使用initArgs按分组改变初始状态

可以使用initArgs选项去改变$accumulator的初始状态,在某些情况下是比较有用的,比如:

  • 使用状态中没有的字段值来影响状态
  • 根据正在处理的组,将初始状态设置为不同的值。

restaurants集合有下面的内容:

db.restaurants.insertMany([
  { "_id" : 1, "name" : "Food Fury", "city" : "Bettles", "cuisine" : "American" },
  { "_id" : 2, "name" : "Meal Macro", "city" : "Bettles", "cuisine" : "Chinese" },
  { "_id" : 3, "name" : "Big Crisp", "city" : "Bettles", "cuisine" : "Latin" },
  { "_id" : 4, "name" : "The Wrap", "city" : "Onida", "cuisine" : "American" },
  { "_id" : 5, "name" : "Spice Attack", "city" : "Onida", "cuisine" : "Latin" },
  { "_id" : 6, "name" : "Soup City", "city" : "Onida", "cuisine" : "Chinese" },
  { "_id" : 7, "name" : "Crave", "city" : "Pyote", "cuisine" : "American" },
  { "_id" : 8, "name" : "The Gala", "city" : "Pyote", "cuisine" : "Chinese" }
])

假设一个应用允许用户使用这些数据去查找饭店,或许显示更多与用户居住城市相关的饭店会更有用,在这个例子中,假定用户所在的城市是userProfileCity变量。

下面的聚合管道按照city进行分组,操作使用$accumulator来显示与用户资料匹配的城市餐厅的数量:

**注意:**如果在mongosh中执行,需要把initArgs<userProfileCity>替换为实际城市的字符串值,如:“Bettles”。

db.restaurants.aggregate([
{
  $group :
  {
    _id : { city: "$city" },
    restaurants:
    {
      $accumulator:
      {
        init: function(city, userProfileCity) {        // 设置初始状态
          return {
            max: city === userProfileCity ? 3 : 1,     // 如果分组匹配到用户的城市, 返回3个饭店
            restaurants: []                            // 否则, 返回1个饭店
          }
        },

        initArgs: ["$city", <userProfileCity>],        // 传递给init函数的参数

        accumulate: function(state, restaurantName) {  // 定义如何更新状态
          if (state.restaurants.length < state.max) {
            state.restaurants.push(restaurantName);
          }
          return state;
        },

        accumulateArgs: ["$name"],                     // accumulate函数需要的参数

        merge: function(state1, state2) {
          return {
            max: state1.max,
            restaurants: state1.restaurants.concat(state2.restaurants).slice(0, state1.max)
          }
        },

        finalize: function(state) {                   // 调整状态,只返回需要的字段
          return state.restaurants
        }

        lang: "js"
      }
    }
  }
}
])
返回结果

如果userProfileCityBettles,操作返回下面的结果:

{ "_id" : { "city" : "Bettles" }, "restaurants" : { "restaurants" : [ "Food Fury", "Meal Macro", "Big Crisp" ] } }
{ "_id" : { "city" : "Onida" }, "restaurants" : { "restaurants" : [ "The Wrap" ] } }
{ "_id" : { "city" : "Pyote" }, "restaurants" : { "restaurants" : [ "Crave" ] } }

如果userProfileCityOnida,操作返回下面的结果:

{ "_id" : { "city" : "Bettles" }, "restaurants" : { "restaurants" : [ "Food Fury" ] } }
{ "_id" : { "city" : "Onida" }, "restaurants" : { "restaurants" : [ "The Wrap", "Spice Attack", "Soup City" ] } }
{ "_id" : { "city" : "Pyote" }, "restaurants" : { "restaurants" : [ "Crave" ] } }

如果userProfileCity为是别的值,操作返回下面的结果:

{ "_id" : { "city" : "Bettles" }, "restaurants" : { "restaurants" : [ "Food Fury" ] } }
{ "_id" : { "city" : "Onida" }, "restaurants" : { "restaurants" : [ "The Wrap" ] } }
{ "_id" : { "city" : "Pyote" }, "restaurants" : { "restaurants" : [ "Crave" ] } }
执行过程分析

初始化函数init定义了初始状态,包含了maxrestaurants字段,max字段为指定分组设置饭店的最大数量。如果文档的city字段与userProfileCity匹配,分组最多包含3个饭店,否则,如果文档_iduserProfileCity不匹配,分组最多包含一个饭店。init函数从initArgs数组接受cityuserProfileCity参数。

对于$accumulator处理的每个文档,会把饭店的name放到restaurants数组,前提是名称不会让restaurants的长度超过max的值。在所有的文档都被处理完成后,accumulate函数返回更新后的状态。

merge函数定义了如何合并两个状态,它将每个状态的restaurant连接在一起,并且结果数组的长度使用slice方法进行了限制,确保它不会超过max的值。

一旦所有的文档被处理完,finalize函数修改结果状态,值返回饭店的名称,如果没有这个函数,max字段也会包含在输出中,这将不能满足应用的需求。文章来源地址https://www.toymoban.com/news/detail-827564.html

到了这里,关于MongoDB聚合操作符:$accumulator的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【C语言初阶】带你轻松玩转所有常用操作符(1) ——算数操作符,移位操作符,位操作符

    君兮_的个人主页 勤时当勉励 岁月不待人 C/C++ 游戏开发 Hello,这里是君兮_,最近要准备期末复习了,可能更新的就不会那么频繁了,下个星期恢复正常更新。 今天给大家带来的是操作符详解,由于这部分的内容比较多,可能会分成几部分讲,今天带来的是第一部分的内容,废

    2024年02月11日
    浏览(46)
  • 【PostgreSQL】函数与操作符-比较函数和操作符

    PostgreSQL中的比较函数和操作符用于比较两个表达式的值。它们的作用是确定表达式的值是否满足某种条件,例如等于、大于、小于等。 比较函数是一个接受两个参数的函数,返回一个布尔值,表示两个参数是否满足某种条件。例如,equal()函数用于判断两个参数是否相等,

    2024年01月17日
    浏览(53)
  • 初始C语言——详细讲解操作符以及操作符的易错点

     第一章 “C“浒传——初识C语言(更适合初学者体质哦!)  第二章 详细认识分支语句和循环语句以及他们的易错点   第三章 初阶C语言——特别详细地介绍函数  第四章 初始C语言——详细地讲解数组的内容以及易错点  第五章  初始C语言——详细讲解操作符以及操

    2024年02月13日
    浏览(57)
  • 【c语言操作符系列1】^(异或操作符)讲解和多种例题详解

    目录 一、^ 是什么(^称为异或) 二、^的规律(特点) 三、可利用^秒杀的常见例题(重点) 1、消失的数字  2、不一样的人生密码 3、交换两个数(不能创建中间变量) 4、找出只出现一个的两个数字 是一种操作符, 针对二进制异或而言的 ,两个数对应的二进制位相同,异或

    2024年02月16日
    浏览(69)
  • Js中.?和??语法(可选链操作符和双问号操作符)

    Tips:为啥起这么一个标题呢,因为我自己当时看代码,看到这个语法的时候就感觉有些遗忘,但是又不知道他叫做什么名字,所以只能直接搜索.?和??这样搜索,哈哈哈相信不少人可能跟我一样,不知道他叫做什么名字嘿嘿。 可选链 操作符( ?. )允许读取位于连接对象链深

    2024年01月21日
    浏览(46)
  • 【C语言】中的位操作符和移位操作符,原码反码补码以及进制之间的转换

    欢迎大家来到c语言知识小课堂,今天的知识点是操作符和进制 同样都是数字1111,不同进制下数字的大小不同,第二行代表的是其各位数字十进制下的大小,将各位数字的十进制大小相加即1111在这个进制下转化为十进制的大小,从图中我们可以看出来 进制的定义:从右往左

    2024年02月22日
    浏览(52)
  • ES6...扩展操作符骚操作

    复制和合并数组变得更为简洁。不需要使用 concat() 方法或 slice() 方法,一个 … 操作符已经足够: 将数组作为一个需要单独一个个传入参数的函数的参数 对象属性展开复制 如果存在相同的值 后者覆盖前者 合并对象 类似于object.assign 不过,扩展属性并不总能生成与 Object.as

    2024年02月14日
    浏览(40)
  • 前端JS实用操作符,一些骚操作✨

             目录 0、!!  双重逻辑非操作符  📚 1、?? 操作符 空值合并/空判断  ✅ 2、?. 可选链运算符🔍 3、??= 操作符 逻辑空值赋值运算符 💚 4、三元运算符 📗 5、~~ 操作符 双位运算符 🔨 6、与 ||或 短路运算符 🚂 7、| 0 取整 🚁 8、 1 判断奇偶数 🎨 9、_ 数值分割

    2024年02月14日
    浏览(47)
  • <C语言> 操作符

    加法(+):用于将两个操作数相加。 减法(-):用于将第一个操作数减去第二个操作数。 乘法(*):用于将两个操作数相乘。 除法(/):用于将第一个操作数除以第二个操作数。 取模(%):用于求两个操作数相除的余数。 乘法、除法和取模具有相同的优先级,高于加法

    2024年02月12日
    浏览(55)
  • 【C语言】操作符

    算术操作符 移位操作符 位操作符 赋值操作符 单目操作符 关系操作符 逻辑操作符 条件操作符 逗号操作符 下标引用、函数调用和结构成员操作符 除了 % 操作符之外,其他的几个操作符可以作用于整数和浮点数。 对于 / 操作符如果两个操作数都为整数,执行整数除法。而只

    2024年01月16日
    浏览(53)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包