Elasticsearch Boolean Query查询介绍

news/2024/7/7 6:41:09 标签: elasticsearch, 大数据, 搜索引擎

前言

ES 和 Solr 的底层都是基于Apache Lucene 实现,bool 查询的底层实现是Lucene 的 BooleanQuery,其可以组合多个子句查询,类似 SQL 语句里面的 OR 查询。

查询介绍

在 ES 里面 Boolean 查询封装了 4 种 API 接口能力,可以单独使用,也可以组合使用,总结如下:

函数

描述

must

query 关键词在召回文档里面必须包含,参与相关性评分

filter

query 关键词在召回文档里面必须包含,不参与相关性评分,但结果集会被缓存

should

query 关键词在召回文档里面可能包含,如果只有一个 should 子句情况下与 must 子句结果一样,如果有多个should子句情况下,命中任何一个即可召回

must_not

query 关键词在召回文档里面必须排除,不参与相关性评分,但结果集会被缓存

评分介绍

boolean 查询的评分原理是,匹配越多越好,在 must 和 should 子句里面的匹配成功后,最终会将相关性评分累加到 score 里面

查询示例

POST _search
{
  "query": {
    "bool" : {
      "must" : {
        "term" : { "user.id" : "kimchy" }
      },
      "filter": {
        "term" : { "tags" : "production" }
      },
      "must_not" : {
        "range" : {
          "age" : { "gte" : 10, "lte" : 20 }
        }
      },
      "should" : [
        { "term" : { "tags" : "env1" } },
        { "term" : { "tags" : "deployed" } }
      ],
      "minimum_should_match" : 1,
      "boost" : 1.0
    }
  }
}

其他参数介绍

minimum_should_match

该参数控制 should 子句召回的文档,其匹配条件应该达到的数量或百分比,如果 bool 查询只有一个 should 子句且没有 must 和 filter 子句的前提下该参数的值为 1,其他情况下为 0

minimum_should_match参数的取值列表:

类型

例子

说明

正整数

3

固定 3 个,与子句数量无关

负整数

-2

子句总数 - 2

百分比

75%

子句总数 * 0.75 后向下取整

负百分比

-25%

子句总数 - (子句总数*0.25 后向下取整)

组合

3<90%

如果子句数量小于等于3,则全部都是必须的,但如果大于 3,则仅需要 90% 子句满足

多种组合

2<-25% 9<-3

es 支持多种限定条件组合,中间使用空格分隔,每个条件的规范仅在大于前一个的数字有效,在这个例子种,如果子句数量有 1 个或者 2 个,那么两个都是必须的,如果有 3-9 个,则需要除 25%之外的所有子句,如果超过 9 个则需要除 3 个子句之外的所有子句匹配

filter

在 filter 中指定查询对相关性评分没有影响,分数返回都是 0,分数仅受指定查询的影响,例如以下的三个查询都会查询指定条件的文档:

filter query 评分为 0,因为没有指定评分查询
GET _search
{
  "query": {
    "bool": {
      "filter": {
        "term": {
          "status": "active"
        }
      }
    }
  }
}
bool query 有一个 match_all 查询,所以所有文档的评分都为 1.0
GET _search
{
  "query": {
    "bool": {
      "must": {
        "match_all": {}
      },
      "filter": {
        "term": {
          "status": "active"
        }
      }
    }
  }
}
constant_score 与 match_all 类似,分配同样的 1.0 分数
GET _search
{
  "query": {
    "constant_score": {
      "filter": {
        "term": {
          "status": "active"
        }
      }
    }
  }
}

named_queries

可以在每个顶级查询中传入一个 _name命名字段,用来跟踪那些查询与返回的文档匹配,如果使用了命名查询,那么返回的结果种则会包含每个命中的 matched_queries 属性

GET /_search
{
  "query": {
    "bool": {
      "should": [
        { "match": { "name.first": { "query": "shay", "_name": "first" } } },
        { "match": { "name.last": { "query": "banon", "_name": "last" } } }
      ],
      "filter": {
        "terms": {
          "name.last": [ "banon", "kimchy" ],
          "_name": "test"
        }
      }
    }
  }
}

此外在请求中还可以传入一个 include_named_queries_score 参数,可以控制是否返回与匹配查询关联的分数,这里需要注意 在 filter 中的查询,在 must_not上下文种的查询,以及出现在 constant_score 或 function_score_query内查询的分数,不会对文档总分数产生影响

GET /_search?include_named_queries_score
{
  "query": {
    "bool": {
      "should": [
        { "match": { "name.first": { "query": "shay", "_name": "first" } } },
        { "match": { "name.last": { "query": "banon", "_name": "last" } } }
      ],
      "filter": {
        "terms": {
          "name.last": [ "banon", "kimchy" ],
          "_name": "test"
        }
      }
    }
  }
}

此外,命名查询会对查询性能造成一定影响,在 hits 命中量大的时候会更明显,应谨慎使用


http://www.niftyadmin.cn/n/4929877.html

相关文章

2023年初中信息技术学科暑假备课

目录 2023年初中信息技术学科暑假备课1. 创意空间1.1 教师的空间1.2 学生的空间1.3 关于FTP服务器设置 2. 什么是编程2.1 编程语言2.2 人人都应学好编程2.3. 编程难吗&#xff1f;2.4 python用途 3. 开发环境3.1 打开IDLE3.2 IDLE窗口3.2.1 shell窗口和编辑窗口 4. 项目式教学4…

【leetcode】454. 四数相加 II(medium)

给你四个整数数组 nums1、nums2、nums3 和 nums4 &#xff0c;数组长度都是 n &#xff0c;请你计算有多少个元组 (i, j, k, l) 能满足&#xff1a; 0 < i, j, k, l < nnums1[i] nums2[j] nums3[k] nums4[l] 0 思路&#xff1a;如果要暴力&#xff0c;那么时间复杂…

Scala(Scala课程简介)

1、Scala ------------- Java &#xff08;类似于c扩展了c的很多特性&#xff09; 1、Scala基于JVM&#xff0c;和Java完全兼容&#xff0c;同样具有跨平台、可移植性好、方便的垃圾回收等特性 2、Scala比Java更加面向对象 3、Scala是一门函数式编程语言 2、Scala更适合大数据的…

Oracle 知识篇+分区表上的索引由global改为local注意事项

★ 知识点 二、知识点 Local型索引有如下优点 1.Only one index partition must be rebuilt when a maintenance operation other than SPLIT PARTITION or ADD PARTITION is performed on an underlying table partition. 2.The duration of a partition maintenance opera…

背上大书包准备run之CSS篇

时隔一年多又要准备面试嘞。唉&#xff0c;人生呐&#xff0c;真是变幻莫测哟~ 社招应该不会问很多css吧&#xff0c;&#xff0c;&#xff0c;但是应该也会问吧&#xff0c;&#xff0c;&#xff0c;应该是从好多好多问题里只抽一两个问问吧&#x1f62d; 哦还有h5&#xff…

PHP智能人才招聘网站mysql数据库web结构apache计算机软件工程网页wamp

一、源码特点 PHP智能人才招聘网站 是一套完善的web设计系统&#xff0c;对理解php编程开发语言有帮助&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统主要采用B/S模式开发。 下载地址 https://download.csdn.net/download/qq_41221322/88199392 视频演示 PH…

linux配置上网 linux adsl拨号上网设置

Linux里面配置ADSL上网是件很麻烦的事。但配置完成之后就能开机自动拨号上网&#xff0c;可谓十分的方便。支持的系统有Redhat,CentOS,SuSE,FreeBSD,Ubuntu等常见的Linux。 工具/原料 ADSL网络&#xff0c;电信&#xff0c;网通&#xff0c;移动等常见宽带。 Linux系统的安装光…

Java 正则表达式【匹配与分组基本原理】

简介 我们一般使用正则表达式是用来处理字符串的&#xff0c;不管是实际的开发中还是我们的算法竞赛中&#xff0c;使用正则表达式绝对可以大大提升我们的效率。 正则表达式&#xff08;regular expression&#xff09;其实就是对字符串进行模式匹配的技术。 快速入门 我们这里…