百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

Linux服务器开发之MySQL 集群方案

yuyutoo 2024-11-08 15:39 3 浏览 0 评论

案例:

100W 的客户端,每三分钟上传一次数据。数据库如何设计?能够查询所有记录?

官方 MySQL 集群方案

MySQL Replication

MySQL Replication 是 mysql 自带的功能,主从复制是通过重放 binlog 实现主库数据的

异步复制。即当主库执行了一条 sql 命令,那么在从库同样地执行一遍,从而达到主从复制

的效果。在这个过程中,master 对数据的写操作记入二进制日志文件中(binlog),生成一

个 log dump 线程,用来给从库的 i/o 线程传 binlog。而从库的 i/o 线程去请求主库的

binlog,并将得到的 binlog 日志写到中继日志(relaylog)中,从库的 sql 线程,会读

取 relaylog 文件中的日志,并解析成具体操作,通过主从的操作一致,而达到最终数据一

致。

MySQL Replication 一主多从的结构,主要目的是实现数据的多点备份(没有故障自动转移和

负载均衡)。相比于单个的 mysql,一主多从下的优势如下:

1. 如果让后台读操作连接从数据库,让写操作连接主数据库,能起到读写分离的作用,这

个时候多个从数据库可以做负载均衡。

2. 可以在某个从数据库中暂时中断复制进程,来备份数据,从而不影响主数据的对外服务

(如果在 master 上执行 backup,需要让 master 处于 readonly 状态,这也意味着所有的

write 请求需要阻塞)。

就各个集群方案来说,其优势为:

1. 主从复制是 mysql 自带的,无需借助第三方。

2. 数据被删除,可以从 binlog 日志中恢复。

3. 配置较为简单方便。

其劣势为:

1. 从库要从 binlog 获取数据并重放,这肯定与主库写入数据存在时间延迟,因此从库的数

据总是要滞后主库。

2. 对主库与从库之间的网络延迟要求较高,若网络延迟太高,将加重上述的滞后,造成最

终数据的不一致。

3. 单一的主节点挂了,将不能对外提供写服务。

配置主机:

$ sudo vim /etc/mysql/my.cnf

添加 log-bin , server_id
修改 bind-address = 0.0.0.0
mysql > create user replication@'%' identified by '123456';
mysql > grant all privileges on *.* to 'replication'@'%' identified by '123456' with grant option;
mysql > show master status;

配置从机

mysql > change master to master_host='192.168.189.133', master_port=3306,
master_user='replication', master_password='123456', master_log_file='mysql-bin.000001',
master_log_pos=380;
mysql > start slave;
mysql> show slave status\G

问题 1

# mysql –u root -p
> create user ‘wangbojing’@’%’ identified by ‘123456’;
> grant all privileges on *.* to ‘wangbojing’@’%’ identified by
‘123456’ with grant option;
> SHOW DATABASES;
> CREATE DATABASE VIP_ORDER;
> CREATE TABLE TBL_USER (
> U_ID INT PRIMARY KEY NOT NULL AUTO_INCREMENT,
> U_NAME VARCHAR(64) NOT NULL,
> U_IMAGE LONGBLOB,
> U_GENDER VARCHAR(64)
> )

# 性能测试

# sysbench src/lua/oltp_read_write.lua --tables=3 --table_size=500000 -
-mysql-user=root --mysql-password=123456 --mysql-host=192.168.2.217
mysql-port=3306 --mysql-db=TBL_REPLICATION prepare
# sysbench src/lua/oltp_point_select.lua --tables=3 --table_size=500000 --mysql
user=root --mysql-password=zhaomeiping --mysql-host=192.168.2.217 --mysql-port=3306
--mysql-db=TBL_REPLICATION --threads=128 --time=100 --report-interval=5 run

MySQL Fabirc

MySQL Fabirc,是 mysql 官方提供的。这是在 MySQL Replication 的基础上,增加了故障检测

与转移,自动数据分片功能。不过依旧是一主多从的结构,MySQL Fabirc 只有一个主节点,

区别是当该主节点挂了以后,会从从节点中选择一个来当主节点。

就各个集群方案来说,其优势为:

1. mysql 官方提供的工具,无需第三方插件。

2. 数据被删除,可以从 binlog 日志中恢复。

3. 主节点挂了以后,能够自动从从节点中选择一个来当主节点,不影响持续对外提供写服

务。

其劣势为:

1. 从库要从 binlog 获取数据并重放,这肯定与主库写入数据存在时间延迟,因此从库的数

据总是要滞后主库。

2. 对主库与从库之间的网络延迟要求较高,若网络延迟太高,将加重上述的滞后,造成最

终数据的不一致。

3. 2014 年 5 月推出的产品,数据库资历较浅,应用案例不多,网上各种资料相对较少。

4. 事务及查询只支持在同一个分片内,事务中更新的数据不能跨分片,查询语句返回的数

据也不能跨分片。

5. 节点故障恢复 30 秒或更长(采用 InnoDB 存储引擎的都这样)。

MySQL Cluster

MySQL 集群(MySQL Cluster)也是 mysql 官方提供的。

MySQL Cluster 是多主多从结构的

就各个集群方案来说,其优势为:

1.

mysql 官方提供的工具,无需第三方插件。

2.

高可用性优秀,99.999%的可用性,可以自动切分数据,能跨节点冗余数据(其数据集并

不是存储某个特定的 MySQL 实例上,而是被分布在多个 Data Nodes 中,即一个 table 的

数据可能被分散在多个物理节点上,任何数据都会在多个 Data Nodes 上冗余备份。任何

一个数据变更操作,都将在一组 Data Nodes 上同步,以保证数据的一致性)。

3.

可伸缩性优秀,能自动切分数据,方便数据库的水平拓展。

4.

负载均衡优秀,可同时用于读操作、写操作都都密集的应用,也可以使用 SQL 和 NOSQL

接口访问数据。

5.

多个主节点,没有单点故障的问题,节点故障恢复通常小于 1 秒。

其劣势为:

1. 架构模式和原理很复杂。

2. 只能使用存储引擎 NDB ,与平常使用的 InnoDB 有很多明显的差距。比如在事务(其

事务隔离级别只支持 Read Committed,即一个事务在提交前,查询不到在事务内所做的

修改),外键(虽然最新的 NDB 存储引擎已经支持外键,但性能有问题,因为外键所关

联的记录可能在别的分片节点),表现制上的不同,可能会导致日常开发出现意外。

3. 作为分布式的数据库系统,各个节点之间存在大量的数据通讯,比如所有访问都是需要

经过超过一个节点(至少有一个 SQL Node 和一个 NDB Node)才能完成,因此对节点之

间的内部互联网络带宽要求高。

4. Data Node 数据会被尽量放在内存中,对内存要求大,而且重启的时候,数据节点将数

据 load 到内存需要很长时间。

第三方集群方案

MMM

MMM(Master Replication Manager for MySQL)是双主多从结构,MMM 是在 MySQL Replication

的基础上,对其进行优化。这是 Google 的开源项目,使用 Perl 语言来对 MySQL Replication

做扩展,提供一套支持双主故障切换和双主日常管理的脚本程序,主要用来监控 mysql 主主

复制并做失败转移。

注意:这里的双主节点,虽然叫做双主复制,但是业务上同一时刻只允许对一个主进行写入,

另一台备选主上提供部分读服务,以加速在主主切换时刻备选主的预热。

就各个集群方案来说,其优势为:

1. 自动的主主 Failover 切换,一般 3s 以内切换备机。

2. 多个从节点读的负载均衡。

其劣势为:

1. 无法完全保证数据的一致性。如主 1 挂了,MMM monitor 已经切换到主 2 上来了,而若

此时双主复制中,主 2 数据落后于主 1(即还未完全复制完毕),那么此时的主 2 已经成

为主节点,对外提供写服务,从而导致数据不一。

2. 由于是使用虚拟 IP 浮动技术,类似 Keepalived,故 RIP(真实 IP)要和 VIP(虚拟 IP)在

同一网段。如果是在不同网段也可以,需要用到虚拟路由技术。但是绝对要在同一个 IDC

机房,不可跨 IDC 机房组建集群。

MHA

MHA(Master High Availability)是多主多从结构,MHA 是在 MySQL Replication 的基础上,对

其进行优化。这是日本 DeNA 公司的 youshimaton 开发,主要提供更多的主节点,但是缺少

VIP(虚拟 IP),需要配合 keepalived 等一起使用。

要搭建 MHA,要求一个复制集群中必须最少有三台数据库服务器,一主二从,即一台充当

master,一台充当备用 master,另外一台充当从库。

就各个集群方案来说,其优势为:

1. 可以进行故障的自动检测和转移

2. 具备自动数据补偿能力,在主库异常崩溃时能够最大程度地保证数据的一致性。

其劣势为:

1. MHA 架构实现读写分离,最佳实践是在应用开发设计时提前规划读写分离事宜,再使用

时设置两个连接池,即读连接池与写连接池,也可以选择这种方案即引入 SQL Proxy。但

无论如何都需要改动代码;

2. 关于读负载均衡可以使用 F5、LVS、HAPROXY 或者 SQL Proxy 等工具,只要能实现负载均

衡、故障检查及备升级为主后的读写剥离功能即可,建议使用 LVS

Galera Cluster

Galera Cluster 是由 Codership 开发的 MySQL 多主结构集群,这些主节点互为其它节点的从节

点。不同于 MySQL 原生的主从异步复制,Galera 采用的是多主同步复制,并针对同步复制

过程中,会大概率出现的事务冲突和死锁进行优化,就是复制不基于官方 binlog 而是 Galera

复制插件,重写了 wsrep api。异步复制中,主库将数据更新传播给从库后立即提交事务,而

不论从库是否成功读取或重放数据变化。这种情况下,在主库事务提交后的短时间内,主从

库数据并不一致。同步复制时,主库的单个更新事务需要在所有从库上同步 更新。换句话

说,当主库提交事务时,集群中所有节点的数据保持一致。

对于读操作,从每个节点读取到的数据都是相同的。对于写操作,当数据写入某一节点后,

集群会将其同步到其它节点。

就各个集群方案来说,其优势为:

1. 多主多活下,可对任一节点进行读写操作,就算某个节点挂了,也不影响其它的节点的

读写,都不需要做故障切换操作,也不会中断整个集群对外提供的服务。

2. 拓展性优秀,新增节点会自动拉取在线节点的数据(当有新节点加入时,集群会选择出

一个 Donor Node 为新节点提供数据),最终集群所有节点数据一致,而不需要手动备份

恢复。

其劣势为:

能做到数据的强一致性,毫无疑问,也是以牺牲性能为代价。

更多技术点欢迎关注!

相关推荐

Java开发中如何优雅地避免OOM(OutOfMemoryError)

Java开发中如何优雅地避免OOM(OutOfMemoryError)在这个信息化高速发展的时代,内存就像程序员手中的笔,缺了它就什么都写不出来。而OOM(OutOfMemoryError)就像是横在...

常见的JVM调优方法和步骤

1、内存调优堆内存设置:通过-Xms和-Xmx参数调整初始和最大堆内存大小-Xms:初始堆大小(如-Xms512M)-Xmx:最大堆大小(如-Xmx2048M)调整新生代和老年代的比例...

Java中9种常见的CMS GC问题分析与解决(一)

目前,互联网上Java的...

JDK21新特性:Prepare to Disallow the Dynamic Loading of Agents

PreparetoDisallowtheDynamicLoadingofAgentsJEP451:准备禁止动态加载代理摘要...

Java程序GC垃圾回收机制优化指南

Java程序GC垃圾回收机制优化指南作为一个Java开发者,我们经常会在任务管理器里看到Java进程占用内存不断增长,然后突然下降的现象。这其实就是在Java虚拟机中运行的垃圾回收(GC)机制在起作用...

Java Java命令学习系列(一)——Jps

jps位于jdk的bin目录下,其作用是显示当前系统的java进程情况,及其id号。jps相当于Solaris进程工具ps。不象”pgrepjava”或”ps-efgrepjava”,jps...

面试题专题:头条一面参考答案(003)

前两篇文章也都是介绍头条一面的内容及参考答案...

Java JVM原理与性能调优:从基础到高级应用

一、JVM基础架构与内存模型1.1JVM整体架构概览Java虚拟机(JVM)是Java程序运行的基石,它由以下几个核心子系统组成:...

死锁攻防战:阿里架构师教你用3种核武器杜绝程序僵死

从线程转储分析到银行家算法,彻底掌握大厂必考的死锁解决方案以下是为Java死锁问题设计的结构化技术解析方案,包含代码级解决方案与高频追问应对策略:...

Java 1.8 虚拟机内存分布详解

Java1.8虚拟机内存分布详解Java1.8的JVM内存布局相比早期版本有显著变化(如永久代被元空间取代)。以下是其核心内存区域的划分、作用及配置参数:一、JVM内存整体结构...

Java 多线程开发难题?这篇文章给你答案!

作为互联网大厂的后端开发人员,在Java多线程开发过程中,必然会面临诸多复杂且具有挑战性的问题。在高并发场景下,各类潜在问题对系统的稳定性与性能产生严重影响,本文将深入探讨这些问题,并提供全面且有...

软件性能调优全攻略:从瓶颈定位到工具应用

性能调优是软件测试中的重要环节,旨在提高系统的响应时间、吞吐量、并发能力、资源利用率,并降低系统崩溃或卡顿的风险。通常,性能调优涉及发现性能瓶颈、分析问题根因、优化代码和系统配置等步骤,调优之前需要先...

JVM性能优化实战技巧

JVM性能优化实战技巧在现代企业级应用开发中,JavaVirtualMachine(JVM)作为承载Java应用程序的核心引擎,其性能直接决定了系统的响应速度、吞吐量以及资源利用率。因此,掌握一些...

JVM 深度解析:运行时数据区域、分代回收与垃圾回收机制全攻略

共同学习,有错欢迎指出。JVM运行时数据区域1.程序计数器程序计数器是一块较小的内存空间,可看作当前线程所执行的字节码的行号指示器。在虚拟机概念模型里,字节码解释器通过改变这个计数器的值选取下一条...

JVM内存管理详解与调优实战

JVM内存管理详解与调优实战Java虚拟机(JVM)作为Java程序运行的核心组件,其内存管理机制直接影响着应用程序的性能表现。今天,咱们就来一场既严肃又有趣的JVM内存管理之旅,看看这个“幕后英雄”...

取消回复欢迎 发表评论: