百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

后端必备分布式技术之-调度系统Quartz设计原理

yuyutoo 2024-11-01 15:55 3 浏览 0 评论

调度系统作为分布式系统技术中重要的一环,了解其技术原理必不可少,不同系统内部采用的调度系统叫法不一样,但大致功能都类似,而Quartz作为经典的开源企业级调度系统,怎么能不研究一下呢?

为什么要学习quartz源码?

  • 调度系统很重要而且很常见,quartz又是业内知名产品,在企业中得到了广泛的应用
  • 学习好的系统设计可以提升自己的系统设计能力,后续涉及到任务调度相关功能,做起来更轻松和更稳定

概念

  • Job代表一个任务实例。 Job由Jobdetail配置的实例信息生成。
  • JobDetail代表一个任务配置详情。
  • Trigger代表调度参数的配置,什么时候发起调用,时间策略的调度。
  • Scheduler:调度容器,一个Scheduler可以注册多个JobDetail和Trigger。只有JobDetail和Trigger组合到一起,才能被Scheduler调度。
  • JobStore:保存和读取JobDetail与Trigger的地方,可以存储在内存或者数据库中。

Demo

来一段代码实际感受下Quartz的使用方式,有助于了解其概念:

1 假如mvn依赖,mysql和HikariCP用于持久化任务配置。

<!-- https://mvnrepository.com/artifact/org.quartz-scheduler/quartz -->
        <dependency>
            <groupId>org.quartz-scheduler</groupId>
            <artifactId>quartz</artifactId>
            <version>2.3.0</version>
        </dependency>
        <dependency>
            <groupId>org.quartz-scheduler</groupId>
            <artifactId>quartz-jobs</artifactId>
            <version>2.2.1</version>
        </dependency>
        <dependency>
            <groupId>mysql</groupId>
            <artifactId>mysql-connector-java</artifactId>
            <version>5.1.35</version>
        </dependency>
        <!-- https://mvnrepository.com/artifact/com.zaxxer/HikariCP -->
        <dependency>
            <groupId>com.zaxxer</groupId>
            <artifactId>HikariCP</artifactId>
            <version>2.2.5</version>
        </dependency>
复制代码

2 准备Demo代码

//创建一个简单的Job接口类
public class HelloJob implements Job {
    @Override
    public void execute(JobExecutionContext jobExecutionContext) throws JobExecutionException {
        System.out.println("hello quartz!");
    }
}
// 1. 通过工厂的方式创建Scheduler
// 2. JobDetail指定Job为HelloJob
// 3. Trigger执行策略为每个10s重复执行一次调度作业
public class SchedulerTest {
    private static SchedulerFactory factory = new StdSchedulerFactory();

    public static void main(String[] args) throws SchedulerException {
        Scheduler scheduler = factory.getScheduler();
        scheduler.start();

        // JobDetail
        JobDetail job = JobBuilder.newJob(HelloJob.class)
            .withIdentity("myJob", "group")
            .build();

        // Trigger
        Trigger trigger = TriggerBuilder.newTrigger()
            .withIdentity("myTrigger", "group")
            .startNow()
            .withSchedule(simpleSchedule()
                .withIntervalInSeconds(10)
                .repeatForever())
            .build();

        // 调度
        scheduler.scheduleJob(job,trigger);
    }
}
复制代码

3 默认情况下JobDetail和Trigger是存储在内存中的,如果想要持久化到数据库中,可以新增quartz.properties,修改配置准备数据库脚本。

  • 数据库脚本:数据表脚本:raw.githubusercontent.com/quartznet/q…
  • Quartz配置:
# quartz数据库的表前缀
org.quartz.jobStore.tablePrefix = QRTZ_
# 持久化使用的类,JobStoreTX支持事物的提交和回滚
org.quartz.jobStore.class = org.quartz.impl.jdbcjobstore.JobStoreTX
org.quartz.jobStore.driverDelegateClass = org.quartz.impl.jdbcjobstore.StdJDBCDelegate

# 数据源的标记,配置之后quartz会根据值作为前缀获取数据库的配置
# 在StdSchedulerFactory类中搜索 String[] dsNames = cfg.getPropertyGroups(PROP_DATASOURCE_PREFIX); 查看这部分代码
org.quartz.jobStore.dataSource = myDS

# 配置数据库
org.quartz.dataSource.myDS.driver = com.mysql.jdbc.Driver
org.quartz.dataSource.myDS.URL = jdbc:mysql://localhost:3306/quartz-test?characterEncoding=utf-8
org.quartz.dataSource.myDS.user = root
org.quartz.dataSource.myDS.password =
org.quartz.dataSource.myDS.maxConnections = 5
#org.quartz.dataSource.myDS.connectionProvider.class=org.quartz.utils.HikariCpPoolingConnectionProvider
org.quartz.dataSource.myDS.provider=hikaricp


# 其余采用默认的quartz配置
org.quartz.scheduler.instanceName: DefaultQuartzScheduler
org.quartz.scheduler.rmi.export: false
org.quartz.scheduler.rmi.proxy: false
org.quartz.scheduler.wrapJobExecutionInUserTransaction: false

org.quartz.threadPool.class: org.quartz.simpl.SimpleThreadPool
org.quartz.threadPool.threadCount: 10
org.quartz.threadPool.threadPriority: 5
org.quartz.threadPool.threadsInheritContextClassLoaderOfInitializingThread: true

org.quartz.jobStore.misfireThreshold: 60000
复制代码

运行结果:

数据表解释:


原理设计

UML类图


  • 两个主要线程:QuartzSchdulerThread与MisfireHandler 调度任务的核心执行逻辑在QuartzSchdulerThread中 MisfireHandler用于解决任务未触发问题。
  • JobStore对Job和Trigger的增删改查,JobRunShell将框架与我们自定义的业务Job进行关联起来处理

Quartz主要启动过程

通过时序图,了解Quartz大部分核心类的创建时机。

1 首先创建调度工厂类,一般使用StdSchedulerFactory,通过工厂类创建Scheduler。Scheduler的属性可通过quartz.properties配置

2 以Scheduler的标准实现StdScheduler为例,其为QuartzScheduler的代理类,主要行为通过QuartzScheduler来实现。

3 QuartzScheduler实例化的时候也是在StdSchedulerFactory中,它主要使用两个对象。

  • QuartzSchedulerResources 实例化与StdSchedulerFactory中,包含Scheduler创建和运行过程的主要资源,如JobStore和ThreadExecutor。
  • QuartzSchedulerThread 负责触发Trigger,通过SchedulerSignaler进行交互

Quartz任务调度过程

我们创建的任务是怎么被调度的?主要在调度线程QuartzSchedulerThread中实现,其大致逻辑

1 先获取线程池中可以使用的线程数量,如果没有可以用的线程会阻塞到有可用的线程。 配置:org.quartz.threadPool.xxx

2 通过JobStore获取接下来30秒钟内要执行的trigger。org.quartz.spi.JobStore#acquireNextTriggers

3 循环与waiting到任务配置的触发时间

4 进行触发,通过JobStore.triggerFired获取TriggerFiredResult

5 针对每个要执行的TriggerFiredResult,创建JobRunShell,并放入线程池执行

  • JobRunShell调用初始化方法,创建本次要执行Job和JobExecutionContext。 Job = JobDetail.getJobClass().newInstance(), JobExecutionContext包含了本次Job运行的JobDetail和Trigger等信息。
  • 将JobRunnerShell丢到线程池中,从线程池中选一个可用的WorkerThread运行。
  • 运行JobRunnerShell的run方法。job.execute(jec); 执行Job实例代码,执行前后可以通过listner做一些监听。

Quartz任务Misfire过程

Quartz调度器正常情况下获取将来一段时间内要触发的任务,然后循环等待到指定时刻进行执行,但是可能在指定的时间点未执行到配置的任务。出现这种情况的原因:

  • 系统重启,重启的这段时间中,一些任务被misfire
  • trigger被暂停(suspendXXX)的一段时间中,一些任务被misfire
  • 线程池资源不足,任务无法被执行
  • 有些任务在触发时间时,上次正在执行的任务目前还没有结束。

那么Misfire机制的处理原理是什么呢?

  • 假设在0时刻有一个任务需要执行,但是到了当前时刻即图中的80,任务还没有被执行, 如果当前时刻与0时刻要执行的任务大于misfireThreshold,那么0时刻的任务被看做是misfire任务。
  • 然后0时刻的任务会被MisfireHandler检测到,再将其next_trigger_time设置为90(设置为当前时刻之后)。
  • 由于任务的next_trigger_time设置为了当前时刻之后,调度线程会重新检测到这个任务,然后进行触发。

内部run方法的执行流程:

1 扫描在misfireThreshold到此刻时间范围内没有被执行的Trigger。首先进行计数:countMisfiredTriggersInState(conn, STATE_WAITING, getMisfireTime())

2 如果count大于0的话,获取锁,防止并发访问。然后获取需要被触发的Misfire trigger。

3 根据配置的misfireInstruction更新trigger的next_fire_time。主要方法位于:SimpleTriggerImpl#updateAfterMisfire

4 提交connection

5 如果还有更多的misfire任务,休息最短暂的50ms。 如果没有则sleep时间为misfireThreshold

Trigger状态

在网上看到一个有关Trigger状态流转的图,参考下:

一些问题

预估在使用Quartz中可能会存在的问题:

1 数据表结构固定,必须要按照官方给的表结构来吗?

  • 可以自己实现JobStore,参考JobStoreSupport类,自定义表结构

2 Quartz默认使用数据库作为分布式锁,性能太差,如何优化?

  • 自定义LockHandler类,使用Redis实现分布式锁
  • 使用Trigger批处理方式
  • 改变任务执行的顺序
  • 减少上下文的切换

参考:tech.ebayinc.com/engineering…

最后

本人才疏学浅,过程如有不当,希望大佬能指出错误,如有想关于其设计原理讨论的,也欢迎来撩。

会持续更新...

相关推荐

【Socket】解决UDP丢包问题

一、介绍UDP是一种不可靠的、无连接的、基于数据报的传输层协议。相比于TCP就比较简单,像写信一样,直接打包丢过去,就不用管了,而不用TCP这样的反复确认。所以UDP的优势就是速度快,开销小。但是随之...

深入学习IO多路复用select/poll/epoll实现原理

Linux服务器处理网络请求有三种机制,select、poll、epoll,本文打算深入学习下其实现原理。0.结论...

25-1-Python网络编程-基础概念

1-网络编程基础概念1-1-基本概念1-2-OSI七层网络模型OSI(开放系统互联)七层网络模型是国际标准化组织(ISO)提出的网络通信分层架构,用于描述计算机网络中数据传输的过程。...

Java NIO多路复用机制

NIO多路复用机制JavaNIO(Non-blockingI/O或NewI/O)是Java提供的用于执行非阻塞I/O操作的API,它极大地增强了Java在处理网络通信和文件系统访问方面的能力。N...

Python 网络编程完全指南:从零开始掌握 Socket 和网络工具

Python网络编程完全指南:从零开始掌握Socket和网络工具在现代应用开发中,网络编程是不可或缺的技能。Python提供了一系列高效的工具和库来处理网络通信、数据传输和协议操作。本指南将从...

Rust中的UDP编程:高效网络通信的实践指南

在实时性要求高、允许少量数据丢失的场景中,UDP(用户数据报协议)凭借其无连接、低延迟的特性成为理想选择。Rust语言凭借内存安全和高性能的特点,为UDP网络编程提供了强大的工具支持。本文将深入探讨如...

Python 网络编程的基础复习:理解Socket的作用

计算机网络的组成部分在逻辑上可以划分为这样的结构五层网络体系应用层:应用层是网络协议的最高层,解决的是具体应用问题...

25-2-Python网络编程-TCP 编程示例

2-TCP编程示例应用程序通常通过“套接字”(socket)向网络发出请求或者应答网络请求,使主机间或者一台计算机上的进程间可以通信。Python语言提供了两种访问网络服务的功能。...

linux下C++ socket网络编程——即时通信系统(含源码)

一:项目内容本项目使用C++实现一个具备服务器端和客户端即时通信且具有私聊功能的聊天室。目的是学习C++网络开发的基本概念,同时也可以熟悉下Linux下的C++程序编译和简单MakeFile编写二:需...

Python快速入门教程7:循环语句

一、循环语句简介循环语句用于重复执行一段代码块,直到满足特定条件为止。Python支持两种主要的循环结构:for循环和while循环。...

10分钟学会Socket通讯,学不会你打我

Socket通讯是软硬件直接常用的一种通讯方式,分为TCP和UDP通讯。在我的职业生涯中,有且仅用过一次UDP通讯。而TCP通讯系统却经常写,正好今天写了一个TCP通讯的软件。总结一下内容软件使用C#...

Python 高级编程之网络编程 Socket(六)

一、概述Python网络编程是指使用Python语言编写的网络应用程序。这种编程涉及到网络通信、套接字编程、协议解析等多种方面的知识。...

linux网络编程Socket之RST详解

产生RST的三个条件:1.目的地为某端口的SYN到达,然而该端口上没有正在监听的服务器;2.TCP想取消一个已有的连接;3.TCP接收到一个根本不存在的连接上的分节;现在模拟上面的三种情况:cl...

ABB机器人编程实用技巧,多项案例

...

Python中实现Socket通讯(附详细代码)

套接字(socket)是一种在计算机网络中进行进程间通信的方法,它允许不同主机上的程序通过网络相互通信。套接字是网络编程的基础,几乎所有的网络应用程序都使用某种形式的套接字来实现网络功能。套接字可以用...

取消回复欢迎 发表评论: