Elasticsearch:ES|QL 查询中的元数据字段及多值字段

这篇具有很好参考价值的文章主要介绍了Elasticsearch:ES|QL 查询中的元数据字段及多值字段。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

在今天的文章里,我来介绍一下 ES|QL 里的元数据字段以及多值字段。我们可以利用这些元数据字段以及多值字段来针对我们的查询进行定制。这里例子的数据集,请参考文章 “Elasticsearch:ES|QL 快速入门”。

ES|QL 源数据字段

ES|QL 可以访问元数据字段。 目前支持的有:

  • _index:文档所属的索引名称。 该字段的类型为关键字。
  • _id:源文档的 ID。 该字段的类型为关键字。
  • _version:源文档的版本。 该字段的类型为 long。

要启用对这些字段的访问,需要为 FROM source 命令提供专用指令:

FROM index [METADATA _index, _id]

仅当数据源是索引时元数据字段才可用。 因此,FROM 是唯一支持 METADATA 指令的源命令。比如,

POST _query?format=txt
{
  "query": """
    FROM sample_data [METADATA _index, _id]
    | LIMIT 3
  """
}

Elasticsearch:ES|QL 查询中的元数据字段及多值字段,Elasticsearch,ESQL,Elastic,elasticsearch,大数据,搜索引擎,全文检索,数据库,sql

从上面的返回数据中,我们可以看到 _index 及 _id 返回索引名称 sample_data 及文档的 ID。

POST _query?format=txt
{
  "query": """
    FROM sample_data [METADATA _index, _id,  _version]
    | LIMIT 3
    | WHERE _version == 1
    | EVAL key = CONCAT(_index, "_", _id)
    | KEEP _index, _version, _id, key
  """
}

Elasticsearch:ES|QL 查询中的元数据字段及多值字段,Elasticsearch,ESQL,Elastic,elasticsearch,大数据,搜索引擎,全文检索,数据库,sql

此外,与索引字段类似,一旦执行聚合,后续命令将无法再访问元数据字段,除非用作分组字段:

POST _query?format=txt
{
  "query": """
    FROM sample_data [METADATA _index, _id]
    | STATS max= MAX(event.duration) BY _index
  """
}

Elasticsearch:ES|QL 查询中的元数据字段及多值字段,Elasticsearch,ESQL,Elastic,elasticsearch,大数据,搜索引擎,全文检索,数据库,sql

ES|QL 多值字段

ES|QL 可以很好地读取多值字段。多值字段也就是在一个字段里有多个值。通常是以数组的形式出现。

POST /mv/_bulk?refresh
{"index":{}}
{"a":1,"b":[2,1]}
{"index":{}}
{"a":2,"b":3}

多值字段以 txt 数组的形式返回:

POST /_query?format=txt
{
  "query": "FROM mv | LIMIT 2"
}
  1. Elasticsearch:ES|QL 查询中的元数据字段及多值字段,Elasticsearch,ESQL,Elastic,elasticsearch,大数据,搜索引擎,全文检索,数据库,sql

多值字段中值的相对顺序未定义。 它们通常会按升序排列,但不要依赖于此。

重复值

某些字段类型(例如关键字)在写入时删除重复值:

DELETE mv
PUT /mv
{
  "mappings": {
    "properties": {
      "b": {"type": "keyword"}
    }
  }
}
POST /mv/_bulk?refresh
{"index":{}}
{"a":1,"b":["foo","foo","bar"]}
{"index":{}}
{"a":2,"b":["bar","bar"]}
POST /_query?format=txt
{
  "query": "FROM mv | LIMIT 2"
}

Elasticsearch:ES|QL 查询中的元数据字段及多值字段,Elasticsearch,ESQL,Elastic,elasticsearch,大数据,搜索引擎,全文检索,数据库,sql

在 ES|QL 查询结果里,我们看到了该删除。

但其他类型(例如 long)不会删除重复项。

DELETE mv
PUT /mv
{
  "mappings": {
    "properties": {
      "b": {"type": "long"}
    }
  }
}
POST /mv/_bulk?refresh
{"index":{}}
{"a":1,"b":[2,2,1]}
{"index":{}}
{"a":2,"b":[1,1]}
POST /_query?format=txt
{
  "query": "FROM mv | LIMIT 2"
}

Elasticsearch:ES|QL 查询中的元数据字段及多值字段,Elasticsearch,ESQL,Elastic,elasticsearch,大数据,搜索引擎,全文检索,数据库,sql

这都是在存储层。 如果你存储重复的 “long”,然后将它们转换为字符串,则重复项将保留:

DELETE mv
PUT /mv
{
  "mappings": {
    "properties": {
      "b": {"type": "long"}
    }
  }
}
POST /mv/_bulk?refresh
{"index":{}}
{"a":1,"b":[2,2,1]}
{"index":{}}
{"a":2,"b":[1,1]}
POST /_query?format=txt
{
  "query": "FROM mv | EVAL b=TO_STRING(b) | LIMIT 2"
}

Elasticsearch:ES|QL 查询中的元数据字段及多值字段,Elasticsearch,ESQL,Elastic,elasticsearch,大数据,搜索引擎,全文检索,数据库,sql

函数

除非另有说明,函数在应用于多值字段时将返回 null。 此行为可能会在更高版本中改变。

DELETE mv
POST /mv/_bulk?refresh
{"index":{}}
{"a":1,"b":[2,1]}
{"index":{}}
{"a":2,"b":3}
POST /_query?format=txt
{
  "query": "FROM mv | EVAL b + 2, a + b | LIMIT 4"
}

Elasticsearch:ES|QL 查询中的元数据字段及多值字段,Elasticsearch,ESQL,Elastic,elasticsearch,大数据,搜索引擎,全文检索,数据库,sql

通过使用以下之一将字段转换为单个值来解决此限制:

  • MV_AVG
  • MV_CONCAT
  • MV_COUNT
  • MV_MAX
  • MV_MEDIAN
  • MV_MIN
  • MV_SUM
POST /_query?format=txt
{
  "query": "FROM mv | EVAL b=MV_MIN(b) | EVAL b + 2, a + b | LIMIT 4"
}

Elasticsearch:ES|QL 查询中的元数据字段及多值字段,Elasticsearch,ESQL,Elastic,elasticsearch,大数据,搜索引擎,全文检索,数据库,sql文章来源地址https://www.toymoban.com/news/detail-757004.html

到了这里,关于Elasticsearch:ES|QL 查询中的元数据字段及多值字段的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包