Prometheus(三)---监控展示Grafana

上一篇 中搭建好了 Prometheus Server,如何使用 Prometheus 来完成就监控的告警是本文来学习的。同样也是清晰明白监控流程的一个过程。 要监控一套服务,是要获取到服务的指标数据,一种方式是自己写接口,遵循 Prom 的数据模型进行指标的收集,另一种方式是使用社区维护的 exporter 获取指标数据。 想要看到炫酷美观的监控界面,可以搭配 Grafana 来做 Pro...

Helm部署ETCD(备份恢复)

应公司开发要求业务分离需要用到 ETCD 数据库,因为资源问题,也就不申请机器在虚机部署了,准备直接上容器,开发/测试/预生产都上了单节点的 ETCD 对于 ETCD 的容器化部署,官方目前只有 docker 容器的部署方式 https://etcd.io/docs/v3.6/install/ https://github.com/etcd-io/etcd/releases ,有一个 bit...

Kubernetes--StorageClass(二)

之前在学习 storageclass 的时候使用过 nfs-client 的外部存储,原文地址:Kubernetes-StorageClass-动态供给 当时有个 bug,需要修改 apiserver 静态 pod 的配置,今天我使用 1.24.0 的 k8s 集群部署时,仍然有这个 bug,根据当时的方法已经无法解决了,所有找了另一个 nfs 外部存储的方法,项目地址:https://gi...

Prometheus(二)---安装部署

Prometheus官方文档 仅支持二进制部署或者 docker 容器部署。任意一种都行,我这里以二进制为例进行部署。 二进制方式部署在 Prometheus 官网下载对应版本和 CPU 架构的二进制包 $ wget -O /opt/prometheus.tar.gz https://github.com/prometheus/prometheus/releases/download/v2....

Prometheus(一)---介绍及架构理解

Prometheus是一套开源的监控&报警&时间序列数据库的组合,起始是由SoundCloud公司开发的。随着发展,越来越多公司和组织接受采用Prometheus,社区也十分活跃,他们便将它独立成开源项目,并且有公司来运作。google SRE的书内也曾提到跟他们BorgMon监控系统相似的实现是 Prometheus。现在最常见的Kubernetes容器管理系统中,通常会搭配Prometheus进行监控。

Kubernetes生产节点缩容方案

受疫情影响,公司收益也大受影响,从我入职以来一直在进行成本缩减,不要问,问就是我没被裁。现在已经轮到 k8s 节点倒霉了,要准备对几台节点进行裁员,由我来进行方案定制 Kubernetes生产节点缩容方案 worker节点数 14 单节点 16c64g 评估各节点 pod 数量和资源使用情况,根据综合比使用各项资源最少的进行缩减规划工作,尽量减少 pod 驱逐后最小化对业务的实际影响,...

关于容器业务返回308的问题

最近在做 k8s 容器下云的迁移,今天切换域名之后,业务 api 出现308 状态码,我们的环境是:公网负载ip -> nginx -> ingress -> pod,刚开始排查思路一直在 k8s 集群外部,一直无法定位到原因,即使 google 对 308 也是毫无头绪。 后来也想到之前的 ingress 用的阿里云 ACK 自带的,和 ingress-nginx 不同,...

Kubernetes---LoadBalancer和ingress

在之前的文章 通过 Service 访问 Pod 集群 中,学习了两种方法做 pod 负载,分别是 ClusterIPNodePort ,也提到了 LoadBalancer,仅仅是提了一嘴。

在正常的生产环境中,当使用了 NodePort 类型暴露服务时,每台集群节点的 nodeport 端口都能够去访问,

Redis备份恢复

昨天华为云 Redis 迁移下云,我来做数据迁移,我第六感优先使用了 RDB 的方式来拿取备份并恢复数据,RDB 恢复是需要重启的 Redis 服务的,需要 Redis 重新读取 RDB 文件,然后业务出问题了,领导问我怎么恢复的,我说 RDB ,领导就说怎么要用 RDB 啊,在线恢复就好了啊。

Ansible用户切换操作

今天在公司批量执行重启服务的操作,使用 ansible 来做,之前已经做了 root 的免密,但是重启服务的操作要用到 www 用户,然后不想写密码和重传 www 用户的密钥,所以想到了两种方案。当然直接使用 www 也可以,这不是对技术的追求嘛,所以研究一下。 一是使用 shell 模块进行 su - www -c "commond" 来执行 二是使用 ansible ...

Shell(十二)---Shell多进程并发

昨天出去面试,被问到一个问题,shell多进程有写过吗,确实之前的工作内容中也没有过这样的需求,所以决定复盘,找资料学习下多进程的内容。 适用环境在日常工作中写的关于结合 Jenkins 使用 Shell 脚本,其中的 CI/CD 过程也是必须有先后顺序的,如果脚本中任务或者函数模块之间没有存在依赖关系,相互独立,可以使用多进程的方式,快速完成脚本。 简单多进程简单的多进程方式,可以通过 &...

Python(九)---函数

之前有幸学过一个月时间的 Python,到了函数就不行了,什么传参这那的一堆,给我整个懵逼住了,那时候 shell 还是一知半解呢,函数对于我来说太深奥了,知道搞懂 shell 的函数之后,再回想起 Python 的这些内容,会好理解一点。 我这真的是靠着 Shell 打拼天下啊。 函数在每个语言中的功能都类似,比如修改代码容易,重复使用容易,减少代码量等等。 定义函数Python 中使用 ...

Python(八)---while循环

每篇 Python 都以 Shell 做对比开头,但是确实这样学起来对于我来说是简单也快速了很多,同概念的内容可以加快理解,只是语言格式不同, while 循环一般都是用数字做比较来控制循环的运行。 while 语法num = 1 while num <= 5: print("这是第 " + str(num) + " 次循环") ...

Python(七)---函数input()与用户交互

input 和 Shell 中的 read 作用也是相同的,用来与用户做交互使用,用户输入的信息会以变量的形式被保存下来,供程序后续的使用

同样 while 循环的原理和 Shell 中也是一样的,直到条件不符合才会退出循环。

Python(六)---字典与列表之间嵌套

将字典存储在列表中,或将列表作为字典的值,这称为嵌套。 可以在列表中嵌套字典、在字典中嵌套列表,甚至在字典中嵌套字典。 列表嵌套字典一个字典中存储一个外星人的信息(颜色/击杀得分),无法存储第二外星人的信息,这就需要每个外星人都是一个字典,如下 alien_0 = {'color': 'red', 'points': 5} ...




正在载入...
PoweredHexo
HostedAliyun
DNSAliyun
ThemeVolantis
UV
PV
BY-NC-SA 4.0