百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

对比jdk1.8,看jdk24 Stream Gatherers牛逼在哪?

yuyutoo 2025-03-26 18:54 11 浏览 0 评论

Java 1.8 引入了 Stream API,提供了如 map、filter 和 reduce 等中间操作和终端操作,极大地简化了集合处理。然而,对于一些复杂场景,如状态依赖的操作或无限流的处理,JDK 1.8 的能力有限。

JDK 24 中 JEP 485 引入新特性Stream Gatherers,旨在增强 Java Stream API 的灵活性和表达力。它允许开发者定义自定义的中间操作,这些操作可以维护状态、处理无限流,并生成新的流。

一、与 JDK 1.8 的主要变化

1、自定义中间操作

JDK 1.8 的 Stream API 提供了一组固定的中间操作,开发者若需实现自定义逻辑,往往需要使用状态化的 lambda 表达式或外部库,这通常导致代码复杂且难以维护。

Stream Gatherers 引入了 gather 方法,接受一个 Gatherer 对象。Gatherer 类似于 Collector,但用于中间操作而非终端操作。它由四个函数组成:initializer(初始化状态,可选)、integrator(处理每个元素)、combiner(合并并行状态,可选)和 finisher(结束处理,可选)。这允许开发者定义状态依赖的中间操作,例如跟踪前一个元素或缓冲输入。

例如,处理连续重复元素的去重操作,在 JDK 1.8 中可能需要手动维护状态,而在 Stream Gatherers 中可以直接使用 gather 定义更优雅的逻辑。

2、处理无限流

JDK 1.8 的 Stream API 在处理无限流时存在限制,许多操作(如 collect)需要终端操作,容易导致内存溢出或性能问题。

Stream Gatherers 设计上支持无限流的懒惰处理,通过 Gatherer 的机制可以动态生成输出流,特别适合如传感器数据流或事件流的场景。

例如,windowSliding 可以对无限流进行滑动窗口分析,而不会提前加载所有数据。

3、内置 Gatherers

JDK 24 提供了五个内置 Gatherers,位于
java.util.stream.Gatherers 类中,包括:

  1. windowFixed(n):将元素分组为固定大小的窗口。
  2. windowSliding(n):创建滑动窗口,每个窗口包含前一个窗口的元素(除第一个)和下一个元素。
  3. fold(initial, operation):类似左折叠,顺序处理元素。
  4. mapConcurrent(maxConcurrency, mapper):并发执行映射操作,使用虚拟线程。
  5. scan(initial, operation):计算累积结果,类似于前缀和。

这些操作在 JDK 1.8 中要么需要手动实现(如通过 reduce 或自定义收集器),要么完全不可用。例如,windowFixed(4) 可以轻松生成如 [[0,1,2,3], [4,5,6,7]] 的窗口,而 JDK 1.8 需要复杂的缓冲逻辑。

以下表格总结了部分内置 Gatherers 与 JDK 1.8 的对比:

操作

JDK 1.8 实现

Stream Gatherers (JDK 24)

优势

固定窗口(windowFixed)

通过 collect 和手动缓冲,代码复杂

gather(Gatherers.windowFixed(n)),直接可用

简洁,易读,性能优化

滑动窗口(windowSliding)

无直接支持,需要自定义逻辑

gather(Gatherers.windowSliding(n)),内置支持

减少代码量,支持无限流

并发映射(mapConcurrent)

使用 parallelStream().map(),受限于 fork-join 池

gather(Gatherers.mapConcurrent(n, mapper)),用虚拟线程

适合阻塞操作,性能提升

累积计算(scan)

无直接支持,需要手动累积

gather(Gatherers.scan(initial, operation)),内置支持

简化实现,适合顺序处理

二、优化点

1、效率提升

通过标准库优化的内置 Gatherers,开发者可以避免手动实现复杂逻辑,从而减少性能开销。例如,mapConcurrent 使用虚拟线程技术,特别适合 I/O 密集型任务,相比 JDK 1.8 的 parallelStream().map(),能更好地利用现代硬件资源。

自定义 Gatherers 允许开发者针对特定场景优化逻辑,避免 JDK 1.8 中可能出现的冗余计算或内存使用。

2、并行处理

**Gatherer 支持通过 combiner 函数实现并行执行,这与 JDK 1.8 的并行流类似,但更灵活。例如,mapConcurrent 可以配置最大并发数(maxConcurrency),并利用虚拟线程技术,适合阻塞操作的并发处理,相比 JDK 1.8 的 fork-join 池更高效。

3、代码简洁性

Stream Gatherers 减少了复杂变换所需的代码量。例如,JDK 1.8 中实现滑动窗口可能需要手动维护缓冲区和状态,而使用 windowSliding 只需要一行代码。

这不仅提升了代码的可读性,还降低了手动实现的错误风险,特别是在并行场景下。

三、jdk8和jdk24分别实现滑动窗口

假设需要生成大小为 2 的滑动窗口。

1、JDK 1.8 实现

Stream numbers = Stream.of(1, 2, 3, 4, 5);
Stream<List> windows = numbers.collect(ArrayList::new, (list, element) -> {
    if (list.size() == 2) {
        list.remove(0);
    }
    list.add(element);
    if (list.size() == 2) {
        // 需要额外的逻辑将窗口添加到结果流
    }
}, (left, right) -> {
    // 并行合并逻辑复杂
});
// 实现复杂,且难以处理无限流

2、JDK 24 Stream Gatherers 实现

Stream numbers = Stream.of(1, 2, 3, 4, 5);
Stream<List> windows = numbers.gather(Gatherers.windowSliding(2));
// 直接生成 [[1,2], [2,3], [3,4], [4,5]],简洁高效

从上述对比可见,Stream Gatherers 显著简化了实现,特别适合状态依赖的操作。

一个可能出乎意料的细节是,mapConcurrent 的引入利用了虚拟线程技术(Project Loom),这在 JDK 1.8 中完全不可用。它允许并发映射操作在虚拟线程上执行,特别适合 I/O 密集型任务,如网络请求或数据库查询,相比 JDK 1.8 的 parallelStream().map(),性能提升显著。

四、结论

Stream Gatherers 在 JDK 24 中为 Java Stream API 带来了重大改进,相较于 JDK 1.8,它提供了更强的自定义能力、更好的无限流支持和优化的并行处理。通过内置 Gatherers 和自定义操作,开发者可以更高效地处理复杂流变换,提升代码可读性和性能。

相关推荐

ETCD 故障恢复(etc常见故障)

概述Kubernetes集群外部ETCD节点故障,导致kube-apiserver无法启动。...

在Ubuntu 16.04 LTS服务器上安装FreeRADIUS和Daloradius的方法

FreeRADIUS为AAARadiusLinux下开源解决方案,DaloRadius为图形化web管理工具。...

如何排查服务器被黑客入侵的迹象(黑客 抓取服务器数据)

---排查服务器是否被黑客入侵需要系统性地检查多个关键点,以下是一份详细的排查指南,包含具体命令、工具和应对策略:---###**一、快速初步检查**####1.**检查异常登录记录**...

使用 Fail Ban 日志分析 SSH 攻击行为

通过分析`fail2ban`日志可以识别和应对SSH暴力破解等攻击行为。以下是详细的操作流程和关键分析方法:---###**一、Fail2ban日志位置**Fail2ban的日志路径因系统配置...

《5 个实用技巧,提升你的服务器安全性,避免被黑客盯上!》

服务器的安全性至关重要,特别是在如今网络攻击频繁的情况下。如果你的服务器存在漏洞,黑客可能会利用这些漏洞进行攻击,甚至窃取数据。今天我们就来聊聊5个实用技巧,帮助你提升服务器的安全性,让你的系统更...

聊聊Spring AI Alibaba的YuQueDocumentReader

序本文主要研究一下SpringAIAlibaba的YuQueDocumentReaderYuQueDocumentReader...

Mac Docker环境,利用Canal实现MySQL同步ES

Canal的使用使用docker环境安装mysql、canal、elasticsearch,基于binlog利用canal实现mysql的数据同步到elasticsearch中,并在springboo...

RustDesk:开源远程控制工具的技术架构与全场景部署实战

一、开源远程控制领域的革新者1.1行业痛点与解决方案...

长安汽车一代CS75Plus2020款安装高德地图7.5

不用破解原车机,一代CS75Plus2020款,安装车机版高德地图7.5,有红绿灯读秒!废话不多讲,安装步骤如下:一、在拨号状态输入:在电话拨号界面,输入:*#518200#*(进入安卓设置界面,...

Zookeeper使用详解之常见操作篇(zookeeper ui)

一、Zookeeper的数据结构对于ZooKeeper而言,其存储结构类似于文件系统,也是一个树形目录服务,并通过Key-Value键值对的形式进行数据存储。其中,Key由斜线间隔的路径元素构成。对...

zk源码—4.会话的实现原理一(会话层的基本功能是什么)

大纲1.创建会话...

Zookeeper 可观测性最佳实践(zookeeper能够确保)

Zookeeper介绍ZooKeeper是一个开源的分布式协调服务,用于管理和协调分布式系统中的节点。它提供了一种高效、可靠的方式来解决分布式系统中的常见问题,如数据同步、配置管理、命名服务和集群...

服务器密码错误被锁定怎么解决(服务器密码错几次锁)

#服务器密码错误被锁定解决方案当服务器因多次密码错误导致账户被锁定时,可以按照以下步骤进行排查和解决:##一、确认锁定状态###1.检查账户锁定状态(Linux)```bash#查看账户锁定...

zk基础—4.zk实现分布式功能(分布式zk的使用)

大纲1.zk实现数据发布订阅...

《死神魂魄觉醒》卡死问题终极解决方案:从原理到实战的深度解析

在《死神魂魄觉醒》的斩魄刀交锋中,游戏卡死犹如突现的虚圈屏障,阻断玩家与尸魂界的连接。本文将从技术架构、解决方案、预防策略三个维度,深度剖析卡死问题的成因与应对之策,助力玩家突破次元壁障,畅享灵魂共鸣...

取消回复欢迎 发表评论: