Elastic boosting的使用

news/2024/7/7 5:54:22 标签: elasticsearch

boosting介绍

Boosting查询允许您降低与负面查询匹配的文档的相关性评分

boosting语法

GET /_search
{
  "query": {
    "boosting": {
      "positive": {
        "term": {
          "text": "apple"
        }
      },
      "negative": {
        "term": {
          "text": "pie tart fruit crumble tree"
        }
      },
      "negative_boost": 0.5
    }
  }
}
关键词语法介绍
positive这是主要要匹配的查询 ,只会展示positive 条件匹配的结果
negative这是要降低相关性分数的查询
negative_boost一个在0到1之间的值,用于降低与negative查询匹配的文档的相关性评分

查询流程

  1. 执行正向(Positive)查询 ElasticSearch首先执行正向查询,获取与之匹配的文档集合。这个查询是Boosting查询的主要部分。
  2. 执行反向(Negative)查询 然后,ElasticSearch执行反向查询,获取与之匹配的文档集合。这个查询是用来降低与之匹配文档的相关性分数。
  3. 计算相关性分数 对于每个文档,ElasticSearch计算其相对于正向查询的相关性分数。如果该文档也与反向查询匹配,则其分数会根据negative_boost的值进行降低。
  4. 如果一个文档只与正向查询匹配,则保留原始分数不变
  5. 如果一个文档既与正向查询又与反向查询匹配,则按new_score = old_score * negative_boost计算新的降低后的分数
  6. 排序返回结果 最后,ElasticSearch根据计算出的新相关性分数对匹配文档进行排序,并返回结果。

案例

场景

某电商网站,用户搜索"手机",我们希望对下面几种情况的商品评分分别进行调整:

  1. 如果是苹果手机,给予相对较高的权重
  2. 如果是较新的手机型号(2022年后上市),也给予较高权重
  3. 如果有"旗舰"、"Pro"等词,视为较高端机型而增加权重
  4. 如果是品牌为"X"的机型,则降低权重

索引创建

PUT /products
{
  "mappings": {
    "properties": {
      "name": {
        "type": "text"
      },
      "brand": {
        "type": "keyword"
      },
      "release_date": {
        "type": "date"
      }
    }
  }
}

文档插入

POST /_bulk
{"index":{"_index":"products"}}
{"name":"iPhone 14 Pro Max","brand":"Apple","release_date":"2022-09-15"}
{"index":{"_index":"products"}}
{"name":"小米12S Ultra","brand":"Xiaomi","release_date":"2022-07-04"}
{"index":{"_index":"products"}}
{"name":"华为Mate 50 Pro","brand":"Huawei","release_date":"2022-11-28"}
{"index":{"_index":"products"}}
{"name":"X品牌旗舰新机","brand":"X","release_date":"2021-06-01"}
{"index":{"_index":"products"}}
{"name":"三星Galaxy S23 Ultra","brand":"Samsung","release_date":"2023-02-17"}
{"index":{"_index":"products"}}
{"name":"魅族 Pro 7S","brand":"Meizu","release_date":"2020-05-28"}

查询语句

GET products/_search
{
  "query": {
    "boosting": {
      "positive": {
        "bool": {
          "should": [
            {
              "term": {
                "brand": {
                  "value": "Apple"
                }
              }
            },
            {
              "range": {
                "release_date": {
                  "gte": "2022-01-01"
                }
              }
            },
            {
              "regexp": {
                "name": ".*旗舰|Pro.*"
              }
            }
          ]
        }
      },
      "negative": {
        "term": {
          "brand": {
            "value": "Xiaomi"
          }
        }
      },
      "negative_boost": 0.5
    }
  }
}

http://www.niftyadmin.cn/n/5427053.html

相关文章

【Leetcode】top 100 矩阵

73 矩阵置零 给定一个 m x n 的矩阵,如果一个元素为 0 ,则将其所在行和列的所有元素都设为 0 。请使用 原地 算法。 方法一:拷贝出一个同样大小的矩阵,根据拷贝矩阵在原矩阵上修改元素; 空间复杂度O(mn) 方法二&…

【Emgu CV教程】9.4、形态学常用操作之闭运算

文章目录 一、相关概念1.什么叫闭运算2.闭运算的函数 二、演示1.原始素材2.代码3.运行结果 一、相关概念 1.什么叫闭运算 上一篇讲开运算,这一篇讲闭运算。与开运算相反,闭运算是先进行膨胀后进行腐蚀。回忆一下,膨胀有什么特点&#xff1f…

Python常用语法汇总(三):函数、类

9. 函数 #例1def greet_user(username): # 定义函数 """显示简单的问候语""" print(Hello, username.title() !) greet_user(Jesse) # 调用函数 #例2 def get_formatted_name(first_name,last_name): """返回整洁的姓名&q…

算法基础精选题3.13 模拟

第一题 链接:登录—专业IT笔试面试备考平台_牛客网 来源:牛客网 题号:NC16644 时间限制:C/C 1秒,其他语言2秒 空间限制:C/C 262144K,其他语言524288K 64bit IO Format: %lld 题目描述 在初…

浅谈HTTP 和 HTTPS (中间人问题)

前言 由于之前的文章已经介绍过了HTTP , 这篇文章介绍 HTTPS 相对于 HTTP 做出的改进 开门见山: HTTPS 是对 HTTP 的加强版 主要是对一些关键信息 进行了加密 一.两种加密方式 1.对称加密 公钥 明文 密文 密文 公钥 明文 2.非对称加密 举个例子就好比 小区邮箱 提供一…

EditText不显示系统键盘,可用来显示自定义的键盘

系统键盘 包含普通键盘和现在很多ROM定制的密码安全键盘 调用已下方法即可解决: https://developer.android.google.cn/reference/android/widget/TextView#setShowSoftInputOnFocus(boolean) 但是,此方法是API 21Android 5.0加入的, 所以为了兼容低版本, 建议使用已下方法: p…

FPGA - 单总线协议(one-wire)

1,简介 单总线(one-wire)是美国 DALLAS 公司推出的外围串行扩展总线技术,与 SPI、I2C 等串行数据通信方式不同,它采用单根信号线,既传输时钟又传输数据,而且数据传输是双向的。它具有节省 I/O口…

MySQL是什么

MySQL 是一种广泛使用的关系型数据库管理系统(RDBMS),它是由瑞典MySQL AB公司开发的,并在后续被Sun Microsystems收购,最终在2010年归入Oracle公司麾下。MySQL设计用来高效处理大规模的数据库工作负载,尤其…