百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

Kubernetes 升级填坑指南(一) kubernetes plugin

yuyutoo 2024-10-20 13:13 5 浏览 0 评论


原创 YP小站 YP小站


来自专辑

Kubernetes故障解决

前言

下面 “坑” 都是作者升级 Kubernetes 遇到的问题并给出解决方法,目的就是避免读者不要在掉进同样的坑中。

第一个坑

升级 Calico 网络组件

要求

Calico v3.2.3 升级到 v3.14.0

遇到的问题

Readiness probe failed: caliconode is not ready: BIRD is not ready: BGP not established with 172.18.0.1

问题原因

通过 calicoctl node status 命令排查,能看到 Calico 自动发现网卡出错。Calico 默认自动会识别第一个网卡,但是后面因为在宿主机使用 docker-compose 创建新的服务并且也会创建一个新的网卡,Calico 重启后自动识别 docker-compose 创建的网卡。导致集群 node 节点不能相互通信,就会报上面错误。

解决方法

临时解决方法:

把 docker-compose 创建的服务直接使用 docker run 来创建,这样就不会创建一个新的网卡。

最终解决方法:

Calico 是通过 Kubernetes yaml 文件部署的,所以直接在 yaml 文件中添加下面配置,在 calico-node DaemonSet env 中添加环境变量,定义网卡发现规则。

            # 定义ipv4自动发现网卡规则
            - name: IP_AUTODETECTION_METHOD
              value: "interface=eth.*"
            # 定义ipv6自动发现网卡规则
            - name: IP6_AUTODETECTION_METHOD
              value: "interface=eth.*"

第二个坑

Calico 组件配置

环境

Kubernetes master 与 node 节点分别在不同云厂商

遇到的问题

[ERROR][8] startup/startup.go 146: failed to query kubeadm’s config map error=Get https://10.10.0.1:443/api/v1/namespaces/kube-system/configmaps/kubeadm-config?timeout=2s: net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting headers)

问题原因

Node工作节点连接不到 apiserver 地址,检查一下calico配置文件,要把apiserver的IP和端口配置上,如果不配置的话,calico默认将设置默认的calico网段和443端口。字段名:KUBERNETES_SERVICE_HOST、KUBERNETES_SERVICE_PORT、KUBERNETES_SERVICE_PORT_HTTPS。

解决方法

Calico 是通过 Kubernetes yaml 文件部署的,所以直接在 yaml 文件中添加下面配置,在 calico-node DaemonSet env 中添加环境变量。

- name: KUBERNETES_SERVICE_HOST
  value: "kube-apiserver"  # master apiserver 地址
- name: KUBERNETES_SERVICE_PORT
  value: "6443"
- name: KUBERNETES_SERVICE_PORT_HTTPS
  value: "6443"

第三个坑

Etcd v3.3.9 升级到 v3.4.7

环境

flannel 使用 v0.10.0 版本

遇到的问题

Etcd 需要升级到 v3.4.7 版本,从 v3.3.9 直接升级到 v3.4.7 是没有问题的。但升级完成后,在查看 flannel 日志时,发现日志不断报 E0714 14:49:48.309007 2887 main.go:349] Couldn't fetch network config: client: response is invalid json. The endpoint is probably not valid etcd cluster endpoint. 错误。刚才开始以为是 flannel 版本过低导致,后面把 flannel 升级到最新版本 v0.12.0,但是问题还是一样。

问题原因

后面仔细通过排查,发现是连接不上 Etcd,当时很疑惑 Etce 连接不上,可 kube-apiserver 连接是正常的,后面才想起来,kube-apiserver 使用 Etcd v3接口,而 flannel使用 v2接口。怀疑在升级 Etcd 时默认没有开启 v2接口。最后查阅官方 Etcd v3.4 发布说明,从 3.4 版本开始,默认已经关闭 v2 接口协议,才导致上面报错。

解决方法

直接在 Etcd 启动参数添加 --enable-v2 'true'

预告

明天分享下作者近期 Kubernetes 从 v1.15.3 升级到 v1.18.5 心得。大家可以关注我的公众号。即时收到明天的 Kubernetes 升级心得哈 ^v^。

相关推荐

微软Win10/Win11版Copilot上线:支持OpenAI o3推理模型

IT之家4月3日消息,科技媒体WindowsLatest昨日(4月2日)发布博文,报道称Windows10、Windows11新版Copilot应用已摘掉Beta帽...

WinForm 双屏幕应用开发:原理、实现与优化

在当今的软件开发领域,多屏幕显示技术的应用越来越广泛。对于WinForm应用程序来说,能够支持双屏幕显示不仅可以提升用户体验,还能满足一些特定场景下的业务需求,比如在演示、监控或者多任务处理等场景...

推荐一个使用 C# 开发的 Windows10 磁贴美化小工具

...

OpenJDK 8 安装(openjdk 8 windows)

通常OpenJDK8和11都能互相编译和通用。我们建议使用11,但是如果你使用JDK8的话也是没有问题的。建议配置使用OpenJDK,不建议使用OracleJDK,主要是因为版...

基于 Linux 快速部署 OpenConnect VPN 服务(ocserv 实战指南)

一、前言在如今远程办公和内网穿透需求日益增长的背景下,搭建一套安全、稳定、高效的VPN系统显得尤为重要。OpenConnectServer(ocserv)是一个开源、高性能的VPN服务端软件...

巧妙设置让Edge浏览器更好用(edge怎么设置好用)

虽然现在新版本的Edge浏览器已经推出,但是毕竟还处于测试的状态中。而Win10系统里面自带的老版Edge浏览器,却越来越不被人重视。其实我们只需要根据实际情况对老版本的Edge浏览器进行一些简单的设...

WPF做一个漂亮的登录界面(wpf页面设计)

...

微软开源博客工具Open Live Writer更新:多项Bug修复

OpenLiveWriter前身是WindowsLiveWriter,是微软WindowsLive系列软件之一,曾经是博主们非常喜爱的一款所见即所得博文编辑工具,支持离线保存,还支持图像编辑...

基于OpenVINO的在线设计和虚拟试穿 | OPENAIGC大赛企业组优秀作品

在第二届拯救者杯OPENAIGC开发者大赛中,涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到,我们特意开设了优秀作品报道专栏,旨在展示其独特之处和开发者的精彩故事。...

C#开源免费的Windows右键菜单管理工具

...

Windows10或11中隐藏的功能,用它再也不用担心电脑中病毒!

...

Python open函数详解(python open函数源码)

演示环境,操作系统:Win1021H2(64bit);Python解释器:3.8.10。open是Python的一个内置函数,一般用于本地文件的读写操作。用法如下。my_file=open(fi...

Windows 11 安装 Docker Desktop(Windows 11 安装助手 Windows 易升 关系)

...

Windows 11 新版发布:屏幕亮度自适应控制,小组件界面重新设计!

...

世界上最好用的Linux发行版之一,OpenSUSE安装及简单体验

背景之前无意在论坛里看到openSUSE的Linux发行版,被称为世界上最好用的Linux发行版之一(阔怕),一直想体验一下,于是这期做一个安装和简单体验教程吧。...

取消回复欢迎 发表评论: