es elasticsearch 十四 各种机制 评分机制 正序索引 解决跳跃结果问题 解决耗时过长问题 解决相同属性值都到一个地方

news/2024/7/7 6:34:50 标签: elasticsearch, 大数据, 搜索引擎

目录

评分机制

机制

查看评分实现如何算出来的explain=true

分析能否被搜索到

Doc value 正排序索引

Query phase

Fetch phase

Preference 问题 解决跳跃结果问题

Timeout 到达时间直接返回,解决耗时过长问题

Routing 数据准确分配到某地,解决相同属性值都到一个地方


评分机制

机制

  1. TF分词频率  关键词在 文档中出现次数 越高 分越高 

  1. IDF 各个词条出现越多越不相关 因为有很多重复的,但是出现越少 但 出现匹配的关键词多二少 则 分高

  1. 字段长度越长分越弱  出现的少则比例高 

查看评分实现如何算出来的explain=true

分析能否被搜索到

Doc value 正排序索引

和数据库一样 为解决排序使用

Query phase

深度分页 各个节点前1万条数据 把id和 匹配分数 给到协调节点

Fetch phase

数据汇总分析 协调节点分析后取值返回

Preference 问题 解决跳跃结果问题

因为插入数据同步主分批和副本分片的数据不同导致跳跃结果

如何解决:

先从主分片上拿 或只从某个分片上取值,就可以避免跳跃结果问题

Timeout 到达时间直接返回,解决耗时过长问题

Get /_search?timeout=10ms

Routing 数据准确分配到某地,解决相同属性值都到一个地方

Get /_search?routing=user123

ok

持续更新


http://www.niftyadmin.cn/n/399476.html

相关文章

事件循环机制、js宏任务和微任务

js代码的执行过程,是js引擎先编译再执行,编译完成两件事:创建执行上下文和生成可执行代码;编译阶段完成后,js引擎开始执行可执行代码; 一、事件循环概述 事件循环即Event Loop,分为两种,分别是…

在三台Linux虚拟机上完成构建集群的前置准备

前言 从现在开始进入到实操阶段,将要在VMware软件中创建多台Linux虚拟机,并进行系统设置。 需要同学们拥有前置知识: VMware的使用经验,知道什么是虚拟机并在VMware中创建过Linux虚拟机(CentOS系统) 熟…

如果你当架构师,从0开始,如何做一个后台项目的架构?

前言 在40岁老架构师 尼恩的读者社群(50)中,很多小伙伴要拿高薪,这就要面试架构师,要完成架构的升级,进入架构赛道。 在架构师的面试过程中,常常会遇到下面的问题: 如果给你一个项目要你从0到1做架构&…

JavaScript while

在JavaScript中,while循环用于在给定条件为真时重复执行一段代码块。while循环的语法如下: javascript while (条件) { // 要执行的代码 } 以下是它的工作原理: 1. 在每次循环迭代之前,会对条件进行评估。如果条件为真&…

数组扁平化的8种方法 - js篇

文章目录 方式1:使用基础的递归遍历方式2:使用reduce函数递归遍历方式3:数组强制类型转换方式4:while循环结合findIndex与concat方式5:直接使用ES6的flat方法方式6:使用JSON的函数和正则表达式方式7&#x…

通过JVM深入理解Java异常机制

JVM内部结构 要深入理解JVM异常处理机制,需要从JVM内部结构开始。 下图描述的主要是Java程序在执行时,由JVM管理的运行时数据区;包括方法区、Java堆、Java虚拟机栈、PC寄存器、本地方法栈,还有常量池。它们又被分为两大类——线程…

防抖和节流以及应用场景

函数防抖(debounce) 就是指触发事件后,在 n 秒内函数只能执行一次,如果触发事件后在 n 秒内又触发了事件,则会重新计算函数延执行时间。 n 秒后再执行该事件,若在 n 秒内被重复触发,则重新计时…

【swapfile】【交换空间】ubuntu22设置交互空间

在Ubuntu 22.04 或更高版本中,MiB Swap 0意味着您的系统当前没有启用交换空间(swap)。交换空间是一种用于暂存不活动内存数据的辅助存储区域,当系统内存不足时,它可以充当扩展内存的作用。 在默认情况下,新…