ES的集群节点发现故障排除指南(3)- end

本文是ES官方文档关于集群节点发现与互联互通的问题排查指南内容,第三部分,结束。

原文参考及相关内容:

英文原文(官网)

第一部分-(1)

第二部分-(2)

节点无法发现或加入稳定的主节点

如果存在一个稳定选举出的主节点,但某个节点无法发现或加入其集群,它将反复使用ClusterFormationFailureHelper记录器记录关于此问题的日志消息。受影响的节点上的Health API也将提供有关此情况的有用信息。受影响的节点和已选举出的主节点上的其他日志消息可能提供有关问题的额外信息。如果日志表明节点由于超时或网络相关问题而无法发现或加入集群,请按以下方式缩小问题范围:

GC暂停

GC暂停会记录在Elasticsearch默认输出的GC日志中,也通常记录在主节点日志中的JvmMonitorService中。使用这些日志来确认节点是否因长时间的GC暂停而经历了高堆内存使用。如果是这样,高堆内存使用问题的故障排除指南中提供了一些建议,以便进行进一步调查,但通常你需要在高堆内存使用期间捕获堆转储以完全理解问题。

VM暂停

VM暂停也会影响同一主机上的其他进程。VM暂停通常还会导致系统时钟出现不连续,Elasticsearch将在其日志中报告这一点。如果你看到其他进程同时暂停的证据,或意外的时钟不连续,请调查你运行Elasticsearch的基础架构。

数据包捕获

数据包捕获将揭示系统级和网络级故障,特别是如果你在所有相关节点上同时捕获网络流量的话。你应该能够观察到节点之间连接上的任何重传、数据包丢失或其他延迟。

可以通过获取主Elasticsearch进程的堆栈转储(例如,使用jstack)或分析跟踪(例如,使用Java Flight Recorder)来识别特定线程可用前的长时间等待,这应在相关日志消息出现前的几秒钟内进行。

节点热线程API

节点热线程API有时会提供有用的信息,但请注意,该API还需要集群中所有节点的多个transport_worker线程和通用线程。API可能会受到你正在尝试诊断的问题的影响。相比之下,jstack更为可靠,因为它不需要任何JVM线程。

涉及发现和集群成员身份的线程主要是transport_workercluster_coordination线程,这些线程不应该有长时间的等待。在Elasticsearch日志中,特别是在org.elasticsearch.transport.InboundHandler的警告日志中,也可能有线程长时间等待的证据。如需更多信息,请参阅网络线程模型。

节点加入集群后又离开

如果一个节点加入集群,但Elasticsearch确定其存在故障,那么它将被再次从集群中移除。如需更多信息,请参阅解决不稳定集群问题的故障排除指南。


http://www.niftyadmin.cn/n/5456885.html

相关文章

关闭Qt在windows上同时生成debug和release目录

qt在windows下编译,例如选择debug模式,但是会在编译目录下生成两个目录,分别是debug和release,生成的exe放在debug目录下。 进行一个简单的测试,读aaa.txt文件,把他放在跟exe同级目录下,测试代码…

Spring Cloud 网关Gateway + 配置中心

网关 网络的接口,负责请求的路由、转发、身份校验 路由:告诉请求去哪找 转发:请求找不到直接带请求过去 路由及转发 判断前端请求的规则就这么配 当前情况下只需要访问8080端口 就可以完成对全部微服务的访问 路由属性 登录校验 没必要在每…

【UEditorPlus】后端配置项没有正常加载,上传插件不能正常使用

解决办法: 1、找到UEditorPlus的根目录,修改 ueditor.all.js 文件 搜索:isJsonp utils.isCrossDomainUrl(configUrl); 更改为:isJsonp false; 2、重新运行前端即可正常使用 如果出现依旧不行,请关闭服务&#xff…

鱼眼相机的测距流程及误差分析[像素坐标系到空间一点以及测距和误差分析]

由于最近在整理单目测距的内容,顺手也总结下鱼眼相机的测距流程和误差分析,如果有错误,还请不吝赐教。 参考链接: 鱼眼镜头的成像原理到畸变矫正(完整版) 相机模型总结(针孔、鱼眼、全景) 三维…

element-ui 自定义点击图标/文本/按钮触发el-date-picker时间组件,不使用插槽

天梦星服务平台 (tmxkj.top)https://tmxkj.top/#/ 1. 图片预览 2.上代码 2.1html <el-button class"hide_input" size"small"><svg t"1711608996149" class"icon" viewBox"0 0 1024 1024" version"1.1"…

VS Code (visual studio code )中文乱码及编码格式问题全解

VS Code 中文乱码及编码格式问题全解_设置vscode 编码-CSDN博客

CUDA从入门到放弃(七):流( Streams)

CUDA从入门到放弃&#xff08;七&#xff09;&#xff1a;流&#xff08; Streams&#xff09; 应用程序通过流来管理并发操作&#xff0c;流是一系列按顺序执行的命令。不同的流可能无序或并发地执行命令&#xff0c;但此行为并不保证。流上的命令在依赖关系满足时执行&#…

ES-LTR粗排模块

官方资源&#xff1a;GitHub - HeiBoWang/elasticsearch-learning-to-rank: Plugin to integrate Learning to Rank (aka machine learning for better relevance) with Elasticsearch Elasticsearch学习排名插件使用机器学习提高搜索相关性排名。它为维基媒体基金会和Snagajo…