百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

java 读写es_ElasticSearch读写一致性问题

yuyutoo 2024-10-28 20:22 3 浏览 0 评论

ES写过程

1.ES会将document发送给coordinate node,节点根据document数据路由到指定的节点,改节点包含该primary shard

2.把文档存储写入到primary shard,如果设置了index.write.wait_for_active_shards=1,那么写完主节点,直接返回客户端,如果 index.write.wait_for_active_shards=all,那么必须要把所有的副本写入完成才返回客户端。详情见官方文档:https://www.elastic.co/guide/en/elasticsearch/reference/5.5/docs-index_.html#index-wait-for-active-shards

3.如果index.write.wait_for_active_shards=1,那么es会异步的把主分片的数据同步到副本分片上去。(在此期间,可能会出现读请求可能读取不到最新数据的情况)

ES读取过程

1.客户端发送请求到任意一个 node,成为 coordinate node

2. coordinate node将请求的查询的条件,找到文档对应的分片和副本节点的地址

3.随机选择一个节点,一般是轮询,肯恩查询主节点,可能查询的是副本节点,然后将数据返回给coordinate node

4.coordinate node将数据返回给客户端。

由于可能存在primary shard的数据还没同步到 replica shard上的情况,所以客户端可能查询到旧的数据,我们可以做相应的调整,保证读取到最新的数据。

GET /_search?preference=_primary

{undefined

"query": {undefined

"match": {undefined

"title": "elasticsearch"

}

}

}

方案2: 执行 Update , Delete , Bulk 等操作时,设备refresh策略,常见的有以下几种,

refresh=true,更新数据之后,立刻对相关的分片(包括副本) 刷新。

refresh=wait_for 这个参数表示,刷新不会立刻进行,而是等待一段时间才刷新 ( index.refresh_interval),默认时间是 1 秒

enum RefreshPolicy implements Writeable {undefined

/**

* Don't refresh after this request. The default.

*/

NONE("false"),

/**

* Force a refresh as part of this request. This refresh policy does not scale for high indexing or search throughput but is useful

* to present a consistent view to for indices with very low traffic. And it is wonderful for tests!

*/

IMMEDIATE("true"),

/**

* Leave this request open until a refresh has made the contents of this request visible to search. This refresh policy is

* compatible with high indexing and search throughput but it causes the request to wait to reply until a refresh occurs.

*/

WAIT_UNTIL("wait_for");

ES写入的底层流程

如图

1.写入的数据先写入一个index_buffer的内存空间中,在index buffer中的数据无法被搜索到,这是ES无法保证100%实时的原因, indices.memory.index_buffer_size配置该空间的大小。

2.在写入index_buffer之前,需要先记录translog,translog用于记录每次写入的数据,在持久化失败后,可用于数据恢复。

3. index_buffer的空间被占满或者达刷新间隔到了index.refresh_interval的值时,会刷新的操作系统的filesystem cache中。

4.filesystem cache中数据,也会在一定的时间间隔,flush到磁盘中,当刷新到磁盘后,就会删除对应的文档的translog中数据。

相关推荐

Java开发中如何优雅地避免OOM(OutOfMemoryError)

Java开发中如何优雅地避免OOM(OutOfMemoryError)在这个信息化高速发展的时代,内存就像程序员手中的笔,缺了它就什么都写不出来。而OOM(OutOfMemoryError)就像是横在...

常见的JVM调优方法和步骤

1、内存调优堆内存设置:通过-Xms和-Xmx参数调整初始和最大堆内存大小-Xms:初始堆大小(如-Xms512M)-Xmx:最大堆大小(如-Xmx2048M)调整新生代和老年代的比例...

Java中9种常见的CMS GC问题分析与解决(一)

目前,互联网上Java的...

JDK21新特性:Prepare to Disallow the Dynamic Loading of Agents

PreparetoDisallowtheDynamicLoadingofAgentsJEP451:准备禁止动态加载代理摘要...

Java程序GC垃圾回收机制优化指南

Java程序GC垃圾回收机制优化指南作为一个Java开发者,我们经常会在任务管理器里看到Java进程占用内存不断增长,然后突然下降的现象。这其实就是在Java虚拟机中运行的垃圾回收(GC)机制在起作用...

Java Java命令学习系列(一)——Jps

jps位于jdk的bin目录下,其作用是显示当前系统的java进程情况,及其id号。jps相当于Solaris进程工具ps。不象”pgrepjava”或”ps-efgrepjava”,jps...

面试题专题:头条一面参考答案(003)

前两篇文章也都是介绍头条一面的内容及参考答案...

Java JVM原理与性能调优:从基础到高级应用

一、JVM基础架构与内存模型1.1JVM整体架构概览Java虚拟机(JVM)是Java程序运行的基石,它由以下几个核心子系统组成:...

死锁攻防战:阿里架构师教你用3种核武器杜绝程序僵死

从线程转储分析到银行家算法,彻底掌握大厂必考的死锁解决方案以下是为Java死锁问题设计的结构化技术解析方案,包含代码级解决方案与高频追问应对策略:...

Java 1.8 虚拟机内存分布详解

Java1.8虚拟机内存分布详解Java1.8的JVM内存布局相比早期版本有显著变化(如永久代被元空间取代)。以下是其核心内存区域的划分、作用及配置参数:一、JVM内存整体结构...

Java 多线程开发难题?这篇文章给你答案!

作为互联网大厂的后端开发人员,在Java多线程开发过程中,必然会面临诸多复杂且具有挑战性的问题。在高并发场景下,各类潜在问题对系统的稳定性与性能产生严重影响,本文将深入探讨这些问题,并提供全面且有...

软件性能调优全攻略:从瓶颈定位到工具应用

性能调优是软件测试中的重要环节,旨在提高系统的响应时间、吞吐量、并发能力、资源利用率,并降低系统崩溃或卡顿的风险。通常,性能调优涉及发现性能瓶颈、分析问题根因、优化代码和系统配置等步骤,调优之前需要先...

JVM性能优化实战技巧

JVM性能优化实战技巧在现代企业级应用开发中,JavaVirtualMachine(JVM)作为承载Java应用程序的核心引擎,其性能直接决定了系统的响应速度、吞吐量以及资源利用率。因此,掌握一些...

JVM 深度解析:运行时数据区域、分代回收与垃圾回收机制全攻略

共同学习,有错欢迎指出。JVM运行时数据区域1.程序计数器程序计数器是一块较小的内存空间,可看作当前线程所执行的字节码的行号指示器。在虚拟机概念模型里,字节码解释器通过改变这个计数器的值选取下一条...

JVM内存管理详解与调优实战

JVM内存管理详解与调优实战Java虚拟机(JVM)作为Java程序运行的核心组件,其内存管理机制直接影响着应用程序的性能表现。今天,咱们就来一场既严肃又有趣的JVM内存管理之旅,看看这个“幕后英雄”...

取消回复欢迎 发表评论: