百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

流行的分布式全局唯一ID解决方案 分布式唯一id生成策略

yuyutoo 2024-10-18 12:10 3 浏览 0 评论

唯一ID的设计在我们系统的开发中是非常重要的,几乎所有的系统设计都离不开ID编码,如电商订单编号、快递单号等。良好的ID编码设计能提高数据存储和检索的效率,便于分布式系统的部署。

这里我们对常用的几种ID编码方式进行整理和对比,以作抛砖引玉,相关算法对应不同编程语言的实现,网上都可以找到很多例子。


雪花算法

雪花算法(Snowflake),twitter公司内部分布式项目采用的ID生成算法,目前广受开发者的欢迎,所以这里做下简单介绍。

雪花算法ID的64位二进制结构如下:

  • 第一段1位为未使用,永远固定为0。
  • 第二段41位为毫秒级时间(41位的长度可以使用69年)。
  • 第三段10位为WorkerId(10位的长度最多支持部署1024个节点)。
  • 第四段12位为毫秒内的计数(12位的计数顺序号支持每个节点每毫秒产生4096个ID序号)。


业务中我们可以64位二进制转换成十进制长整型的形式。因为根据时间生成,所以它是有序的,数据检索性能高。

ID示例:27206497290486784

优点:

1、不依赖系统或者数据库。

2、性能好,稳定性高。

缺点:

1、时钟回拨:强依赖机器时间,如果机器上时钟修改回调,也有可能会导致主键重复的问题。

2、手动配置:WorkerId(机器ID)是需要部署时手动配置的,而且WorkerId不能重复,这在项目部署的时候需要特别注意。


UUID / GUID

UUID(Universally Unique Identifier)通用标识码,GUID(Globals Unique Identifiers)全球唯一标识符。UUID 是一种标准,GUID 是 UUID 的实现之一。UUID编码结构如下:

  • 1~8位采用系统时间,在系统时间上精确到毫秒级保证时间上的唯一性。
  • 9~16位采用底层的IP地址,在服务器集群中的惟一性。
  • 17~24位采用当前对象的HashCode值,在一个内部对象上的惟一性。
  • 25~32位采用调用方法的一个随机数,在一个对象内的毫秒级的唯一性。

ID示例:652b83c2-e18b-41d4-a266-55f63d12df0

优点:

  • 降低全局节点的压力,使得主键生成速度较快。
  • 跨服务器合并数据方便。

缺点:

  • UUID占用16个字符,空间占用较多。
  • 不是递增的有序数字,数据写入IO随机性大,因此检索效率会有所降低。


Redis自增

当使用数据库来生成ID性能不够要求的时候,我们可以尝试使用Redis来生成ID。这主要依赖于Redis是单线程的,所以也可以用生成全局唯一的ID。可以用Redis的原子操作 INCR 和 INCRBY 来实现。

优点:

  • 依赖于数据库,灵活方便,且性能优于数据库。
  • 数字ID天然排序,对分页或者需要排序的结果很有帮助。

缺点:

  • 如果系统中没有Redis,还需要引入新的组件,增加系统复杂度。
  • 需要编码和配置的工作量比较大。


数据库的主键自增

简单易实现,比较常用的ID生成方式,利用数据库自身的主键自增功能实现。

优点:

  • INT和BIGINT类型占用空间较小。
  • 主键自动增长,IO写入连续性好。
  • 数字类型查询速度优于字符串。

缺点:

  • 并发性能不高,受限于数据库性能。
  • 分库分表,需要改造,复杂。
  • 自增有规律,会导致数据泄露。


其他分布式ID

1、滴滴 TinyID

Github地址:GitHub - didi/tinyid: ID Generator id生成器 分布式id生成系统,简单易用、高性能、高可用的id生成系统

2、百度 UidGenerator

Github地址:GitHub - baidu/uid-generator: UniqueID generator

3、美团 Leaf

Github地址:GitHub - Meituan-Dianping/Leaf: Distributed ID Generate Service

4、数据库集群模式

采用数据库集群的模式,对数据库自增ID进行扩充。

5、基于数据库的号段模式

为从数据库批量的获取自增ID,每次从数据库取出一个号段范围,例如 [1,1000] 代表1000个ID,具体的业务服务将本号段,等这批号段ID用完,再次向数据库申请新号段。


总结

以上就是常用的分布式全局唯一ID的解决方案,ID编码方式的选择需要根据数据存储空间的大小要求、数据检索效率高低的要求,还有是否易于系统移植的要求去作出选择,每一种编码方式都不完美,我们需要根据自身业务实际情况,去动态地选择调整。

相关推荐

高一高二第一次月考认真作答(高二第一次月考的重要性)

正在进行高一、高二第一次月考,同学们正在认真完成化学试卷,研究考纲,探究考点,夯实基础,迎战高考!

山清水秀,盛世今朝(山清水秀出处)

万千星河,神州妖娆!山清水秀,盛世今朝!龙腾虎跃,锦绣前程!千里婵娟,祝福永远!

我校二模成绩已新鲜出炉(二模考试成绩)

充电加油备战高考,积极努力再拼一搏...

Argon Design向瑞萨电子有限公司提供Argon Streams VP9许可证

英国剑桥--(美国商业资讯)--领先的先进视频验证解决方案提供商ArgonDesignLtd已与日本半导体公司瑞萨电子有限公司(RenesasElectronicsCorporation)签署...

高考倒计时75天(高考倒计时75天励志语)

今天是2022年3月24日星期四,距离2022年高考还有75天时间对于十八岁的高三学子来说,有些事情的确会影响你们的一生,但是没有一件事能决定你们的一生!努力的意义,就是:以后的日子里,放眼望去,全...

期中考试正在进行(期中考试在即)

转眼即瞬,期中考试已到,紧张忙碌的两个月学习,检验的时刻到了。让我们拿出信心和勇气,来挑战自我。面对考验,我们该做的就是沉着,冷静。让知识来一次次洗礼我们的灵魂,让失败和成功迎接一次次的成长。你们可以...

不要浪费了你NAS上的HDMI接口!详解华硕NAS上HDMI接口的妙用

不要浪费了你NAS上的HDMI接口!详解华硕NAS上HDMI接口的妙用之前我在本站分享我使用的华硕(ASUS)AS6704T...

Java通过Kafka Streams库来实现数据流处理

#暑期创作大赛#...

From abandoned mines to limpid streams waters: how banks profit from EOD

ByZENGYanglinInthecurrentpursuitofthe“dualcarbon”target(carbonpeakingandcarbonneutra...

SPSS与Streams的集成实现实时预测

SPSSModeler是一个数据挖掘工作台,提供了一个可了解数据并生成预测模型的最先进的环境。Streams提供了一个可伸缩的高性能环境,对不断变化的数据进行实时分析,这些数据中包括传统结构的数据...

Kafka Streams, 我还会再使用它吗?

DeeptiMittal4分钟阅读...

大数据Hadoop之——Kafka Streams原理介绍与简单应用示例

一、KafkaStreams概述官网文档:https://kafka.apache.org/32/documentation/streams/...

Android上的TCP今天开始向用户推出,并将在下个月向所有用户提供

据extends网3月15日报道,Firefox今天宣布,其保护用户免受跟踪器攻击的全面cookie保护(TCP)功能现已在Android上可用。该功能默认启动模式,这样,跟踪器将无法收集有关用户的浏...

Linux curl命令(linux curl命令安装)

Linuxcurl命令是一个利用URL规则在命令行下工作的文件传输工具。它支持文件的上传和下载,所以是综合传输工具,但按传统,习惯称curl为下载工具。作为一款强力工具,curl支持包括HTTP、H...

go语言http服务入门详解(go语言http服务器)

当你在浏览器中输入URL时,实际上是在发送一个对Web页面的请求。该请求被发送到服务器。服务器的工作是获取适当的页面并将其作为响应发送回浏览器。在Web的早期,服务器通常读取服务器硬盘上HTML文件的...

取消回复欢迎 发表评论: