使用Spring Cloud的openFeign组件踩坑纪实
yuyutoo 2024-10-12 00:17 6 浏览 0 评论
背景
2021.05.25 晚上,刚要下班回家,突然被拉到一个群里,说是网关有问题,接入的一个应用接口死活注册不上去,新业务无法使用,而且业务方说已经发布过好几次都不生效,但是同一个应用的其他接口却可以正常注册。听起来还挺诡异的,想着重启大法,重启了下网关应用(其实网关好久没有迭代了,挺稳定的)。结果群里更是炸锅了,说原来可以用的接口也没有了,业务完全停滞(小心脏砰砰直跳)。这下搞大了,放下小书包,开始查问题...
解决过程
其实刚开始完全没有头绪,网关没有做任何改动,只是重启应用,怎么会导致业务方原来可以正常使用的接口也无法注册呢?但明显的肯定是业务方改动引起的,因为其他业务方都可以正常使用网关。于是分头行动,我去查找业务接口无法注册网关的原因,业务开发同学查看最近做过哪些变动。
因为无法注册的问题是必现,所以我在本地调试接口注册网关代码,发现他们用到了 spring-cloud 套件,联想起不久前还帮他们查过一个应用无法注册 bean 导致启动失败的案例,初步判断这个事件也跟他们使用 spring-cloud 套件有关。这个怀疑得到了开发的认可,他们确实在二个月前就使用了 spring-cloud 的 openFeign 组件,可一直相安无事呀(后来发现自从引入了 openFeign 组件后,新接口就没注册成功过,:sweat:),为啥网关重启就导致旧接口也无法使用呢?
因为事态紧急,当务之急是恢复服务,可网关重启已经不起作用了,该如何处理呢?这时开发有了一个大胆的想法,因为网关重启前旧接口是正常的,那么只要代码业务代码撤销对 openFeign 的使用,发布上去应该能正常使用,而为了保证业务逻辑,再把代码恢复到使用 openFeign 再次发布,就能将状态恢复到网关重启前的样子。我快速将该思路理了下,又想起了网关有使用到本地缓存来保存拉取到的接口服务列表,跟重启网关导致的接口失效原因吻合,于是同意了他的做法。最终在经历了两轮发布-回滚代码-再发布,其中一个应用终于恢复到了网关重启前状态,业务反馈部分恢复。于是再同样操作把受影响的另一个应用也处理完,业务终于恢复到新接口上线前的状态,才稍微松了一口气。此时距问题发生已经过去了半个小时左右。
但是此时真正原因并没有找到,只是有了初步思路。于是群里回复相关人员:新项目中的一个依赖组件,和网关有冲突,导致服务注册不上。临时解决方案:去掉这个组件后,触发服务正常注册。此时已经晚上十点半了,具体原因只能明天详查了(:flushed:)。
真相大白
第二天一大早来公司,想着尽快解决这个遗留问题。于是开始调试,不得不说,业务引入了 spring-cloud 后,调试链路变得更加复杂,尤其是使用了 openFeign 组件,不知道又做了啥幺蛾子。在触发注册接口的 ServivceBeanExportedEvent 监听器中,总是获取不到已经初始化好的 dubbo bean。经过多次溯源,发现业务方使用了 openFeign 组件后,整个应用上下文变成了如下图所示:
另外,在调试过程中,很诡异的发现 ContextRefreshedEvent 被提早触发了(该业务 Bean 没有完成初始化的情况下)。最终,在跟踪 openFeign 组件初始化中找到端倪:
原来在初始化 openFeign 组件的最后,会调用 SubContext 的 refresh()操作,最终会触发 SubContext 发出 ContextRefreshedEvent 事件。可问题是,子 Context 发出的事件怎么会也触发父 Context 发出类似事件呢?原来这里还有个知识点,在 Spring 框架中,事件(Event)是会沿着 Context 层次向上传播(类似 Dom 模型中的事件冒泡传播),代码如下:
再联系到 dubbo 接口导出服务依赖的 ContextRefreshedEvent 以及 网关注册业务接口所依赖的 ServiceBeanExportedEvent (如下图所示):
整个事件的起因就清楚了, 根本原因:项目依赖的 spring-cloud-openfeign 组件导致 dubbo 接口无法正常注册到网关。 简单来说就是自 Context 发出初始化完成事件,进而引发父 Context 也发出相同事件,而父 Context 此时并没有真正初始化完成。详细解释:
大致依赖关系如下:(基本前提是 spring 框架在发布事件时,会以冒泡方式沿层次架构上报)
1. dubbo 接口 export 需要等待 ContextRefreshedEvent 出现,export 完成后发 ServiceBeanExportedEvent
2. 网关组件依赖的 dubbo-rest 组件会等待 ServivceBeanExportedEvent ,然后上传 dubbo 接口信息到网关。
3.项目依赖的 openFeign 组件在初始化时会生成一个新的 ApplicationContext,以当前存在的 ApplicationContext 为父 Context,形成层次关系。
4.openFeign 组件初始化完成后会进行 Context.refresh(),该操作最后会触发 ContextRefreshedEvent 事件,进而会触发父 Context 发出 ContextRefreshedEvent 事件,导致 dubbo 接口提前初始化,引发错误,因为此时网关 Bean 组件尚未初始化完成,无法完成注册业务接口。
后续
找出事件的真正原因后,就面临着给出解决方案的问题。从上面初始化链路来看,dubbo 服务初始化的时候,确实是 parentContext 发出的 ContextRefreshedEvent ,只不过是由于子 Context 发出而冒泡产生(事件源还是子 Context)。所以要解决这个问题,一个办法就是修改 spring 框架增加是否冒泡参数,另一个就是 dubbo export 时判断 Event 事件源是否为其所属的 Context 发出,两种方式感觉都会对框架造成影响,因为一个是要修改 dubbo 框架的服务导出判断逻辑,一个是 spring 框架的内置逻辑,都不太好处理。
最后我们采用的是,用 @Lazy 注解将 feignClient 的初始化延迟至使用时进行,因为这时其他 Context 下的 bean 都已经初始化完成,不会有上述提前初始化的问题。
github 上也有人遇到类似的问题,大家讨论的方案也都差不多,在 dubbo 官方不打算加入对 event 冒泡做支持的情况下,可以通过
FeignClientInterface client = applicationContext.get(FeignClientInterface.class
复制代码
这样的方式获取 feignClient 实例来规避提前初始化问题(其实效果跟 @Lazy 一样)。
最后贴上一张讨论截图:
诚如网友所提出的方法,即使判断 event 来源自 export 服务也只能解决 dubbo 一个组件的问题,对于其他依赖于 ContextRefreshedEvent 的组件也存在同样的问题,总不能每一个组件都自己修改一遍吧(:joy:)。我觉得还是提议 spring 框架允许设置是否允许事件冒泡来得更靠谱,这样那些靠生成子 Context 存活的组件,也有更多的操作空间(:smirk::smirk:)。
原文链接:https://xie.infoq.cn/article/71dc2fcd5f0a5360b0f017c8a
相关推荐
- 墨尔本一华裔男子与亚裔男子分别失踪数日 警方寻人
-
中新网5月15日电据澳洲新快网报道,据澳大利亚维州警察局网站消息,22岁的华裔男子邓跃(Yue‘Peter’Deng,音译)失踪已6天,维州警方于当地时间13日发布寻人通告,寻求公众协助寻找邓跃。华...
- 网络交友须谨慎!美国犹他州一男子因涉嫌杀害女网友被捕
-
伊森·洪克斯克(图源网络,侵删)据美国广播公司(ABC)25日报道,美国犹他州一名男子于24日因涉嫌谋杀被捕。警方表示,这名男子主动告知警局,称其杀害了一名在网络交友软件上认识的25岁女子。雷顿警...
- 一课译词:来龙去脉(来龙去脉 的意思解释)
-
Mountainranges[Photo/SIPA]“来龙去脉”,汉语成语,本指山脉的走势和去向,现比喻一件事的前因后果(causeandeffectofanevent),可以翻译为“i...
- 高考重要考点:range(range高考用法)
-
range可以用作动词,也可以用作名词,含义特别多,在阅读理解中出现的频率很高,还经常作为完形填空的选项,而且在作文中使用是非常好的高级词汇。...
- C++20 Ranges:现代范围操作(现代c++白皮书)
-
1.引言:C++20Ranges库简介C++20引入的Ranges库是C++标准库的重要更新,旨在提供更现代化、表达力更强的方式来处理数据序列(范围,range)。Ranges库基于...
- 学习VBA,报表做到飞 第二章 数组 2.4 Filter函数
-
第二章数组2.4Filter函数Filter函数功能与autofilter函数类似,它对一个一维数组进行筛选,返回一个从0开始的数组。...
- VBA学习笔记:数组:数组相关函数—Split,Join
-
Split拆分字符串函数,语法Split(expression,字符,Limit,compare),第1参数为必写,后面3个参数都是可选项。Expression为需要拆分的数据,“字符”就是以哪个字...
- VBA如何自定义序列,学会这些方法,让你工作更轻松
-
No.1在Excel中,自定义序列是一种快速填表机制,如何有效地利用这个方法,可以大大增加工作效率。通常在操作工作表的时候,可能会输入一些很有序的序列,如果一一录入就显得十分笨拙。Excel给出了一种...
- Excel VBA入门教程1.3 数组基础(vba数组详解)
-
1.3数组使用数组和对象时,也要声明,这里说下数组的声明:'确定范围的数组,可以存储b-a+1个数,a、b为整数Dim数组名称(aTob)As数据类型Dimarr...
- 远程网络调试工具百宝箱-MobaXterm
-
MobaXterm是一个功能强大的远程网络工具百宝箱,它将所有重要的远程网络工具(SSH、Telnet、X11、RDP、VNC、FTP、MOSH、Serial等)和Unix命令(bash、ls、cat...
- AREX:携程新一代自动化回归测试工具的设计与实现
-
一、背景随着携程机票BU业务规模的不断提高,业务系统日趋复杂,各种问题和挑战也随之而来。对于研发测试团队,面临着各种效能困境,包括业务复杂度高、数据构造工作量大、回归测试全量回归、沟通成本高、测试用例...
- Windows、Android、IOS、Web自动化工具选择策略
-
Windows平台中应用UI自动化测试解决方案AutoIT是开源工具,该工具识别windows的标准控件效果不错,但是当它遇到应用中非标准控件定义的UI元素时往往就无能为力了,这个时候选择silkte...
- python自动化工具:pywinauto(python快速上手 自动化)
-
简介Pywinauto是完全由Python构建的一个模块,可以用于自动化Windows上的GUI应用程序。同时,它支持鼠标、键盘操作,在元素控件树较复杂的界面,可以辅助我们完成自动化操作。我在...
- 时下最火的 Airtest 如何测试手机 APP?
-
引言Airtest是网易出品的一款基于图像识别的自动化测试工具,主要应用在手机APP和游戏的测试。一旦使用了这个工具进行APP的自动化,你就会发现自动化测试原来是如此简单!!连接手机要进行...
- 【推荐】7个最强Appium替代工具,移动App自动化测试必备!
-
在移动应用开发日益火爆的今天,自动化测试成为了确保应用质量和用户体验的关键环节。Appium作为一款广泛应用的移动应用自动化测试工具,为测试人员所熟知。然而,在不同的测试场景和需求下,还有许多其他优...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- mybatis plus (70)
- scheduledtask (71)
- css滚动条 (60)
- java学生成绩管理系统 (59)
- 结构体数组 (69)
- databasemetadata (64)
- javastatic (68)
- jsp实用教程 (53)
- fontawesome (57)
- widget开发 (57)
- vb net教程 (62)
- hibernate 教程 (63)
- case语句 (57)
- svn连接 (74)
- directoryindex (69)
- session timeout (58)
- textbox换行 (67)
- extension_dir (64)
- linearlayout (58)
- vba高级教程 (75)
- iframe用法 (58)
- sqlparameter (59)
- trim函数 (59)
- flex布局 (63)
- contextloaderlistener (56)