Prometheus + Grafana + Cadvisor:构建高效企业级服务监控体系

article/2025/7/19 11:24:13

在现代软件开发和运维领域,容器化技术的应用越来越广泛,其中 Docker 作为最受欢迎的容器化解决方案之一,其容器的监控管理变得至关重要。本文将详细介绍如何使用 cadvisor、Prometheus 和 Grafana 来监控 Docker 容器的状态。

一、安装镜像

我们需要安装几个关键的镜像,这些镜像将帮助我们收集、存储和可视化容器及主机的相关数据。通常,我们会将 cadvisor 和 node - exporter 安装在被监控的主机上,而将 Prometheus 和 Grafana 安装在监控服务器上,不过它们也可以安装在同一台服务器上。

以下是具体的安装命令:

docker pull gcr.io/cadvisor/cadvisor:v0.49.1   # 收集并展示容器的资源使用和性能数据
docker pull prom/prometheus                    # 基于拉取模型收集指标数据,可以设置报警规则
docker pull grafana/grafana                    # 监控数据可视化
docker pull quay.io/prometheus/node-exporter   # 收集主机级别的系统指标

二、添加配置文件

在主机的根目录下,我们需要添加一个 prometheus.yml 文件,并进行如下配置:

global:scrape_interval: 15sevaluation_interval: 15sscrape_timeout: 10salerting:alertmanagers:- static_configs:- targets: ["alertmanager:9093"]rule_files:- "rules/*.rules"scrape_configs:- job_name: "prometheus"static_configs:- targets: ["localhost:9090"]labels:app: "prometheus"environment: "production"- job_name: "docker"  # 监控的docker容器static_configs:- targets: ["监控服务器IP地址或域名:8080"]labels:instance: "docker-host"environment: "production"- job_name: "linux"   # 监控的服务器主机static_configs:- targets: ["监控服务器IP地址或域名:9100"]labels:instance: "server-01"environment: "production"

这些配置项定义了 Prometheus 的全局设置、报警管理、规则文件以及要监控的目标。

三、Compose.yaml 文件编写

通过 docker-compose 来管理多个容器是一种非常便捷的方式。以下是 compose.yaml 文件的内容:

services:prometheus:container_name: prometheusimage: prom/prometheusrestart: unless-stoppednetworks:- 网络名称volumes:- /etc/prometheus.yml:/etc/prometheus/prometheus.yml- prometheus_data:/prometheusports:- "9090:9090"cadvisor:container_name: cadvisorimage: gcr.io/cadvisor/cadvisor:v0.49.1restart: unless-stoppedprivileged: truevolumes:- "/:/rootfs:ro"- "/var/run:/var/run:ro"- "/sys:/sys:ro"- "/var/lib/docker:/var/lib/docker:ro"- "/dev/disk:/dev/disk:ro"ports:- "8080:8080"grafana:container_name: grafanaimage: grafana/grafanarestart: unless-stoppednetworks:- 网络名称volumes:- grafana_data:/var/lib/grafanaports:- "3000:3000"node_exporter:container_name: node_exporterimage: quay.io/prometheus/node-exporter:latestports:- "9100:9100"command:- '--path.rootfs=/host'network_mode: hostpid: hostrestart: unless-stoppedvolumes:- '/:/host:ro,rslave'networks:网络名称:volumes:prometheus_data:grafana_data:

这个文件定义了各个服务的容器配置,包括镜像、重启策略、挂载卷、端口映射等。

四、Grafana 配置

(1)数据源配置

启动 Grafana 后,我们需要添加 Prometheus 作为数据源。在 Grafana 的界面中,按照提示添加 Prometheus 数据源,这将让 Grafana 能够从 Prometheus 中获取监控数据。

(2)仪表板配置

为了更直观地展示监控数据,我们可以在 Grafana 中导入预设的仪表板。在仪表板导入界面,输入仪表板 ID 193 和 9276。其中,193 是 Docker 容器监控模板,9276 是 Linux 主机监控模板。导入后,我们就可以清晰地看到 Docker 容器和 Linux 主机的各项监控指标。

通过以上步骤,我们就完成了 Docker 容器状态的监控系统搭建。利用 cadvisor 收集容器数据,Prometheus 存储和管理数据,Grafana 进行数据可视化,我们可以及时发现容器运行中的问题,保障系统的稳定运行。


http://www.hkcw.cn/article/ZXLFqqZCYt.shtml

相关文章

Kotlin-特殊类型

文章目录 数据类型枚举类型匿名类和伴生对象单例类伴生对象 数据类型 声明一个数据类非常简单: //在class前面添加data关键字表示为一个数据类 data class Student(var name: String, var age: Int)数据类声明后,编译器会根据主构造函数中声明的所有属性自动为其生成以下函数…

大疆上云API+流媒体服务器部署实现直播功能

根据官网文档上云API,先将官方提供的Demo部署起来,后端和前端服务环境搭建请参考官方文档。因为官方文档没有对直播这块的环境搭建进行说明,所以下面主要对直播功能环境搭建做一个记录,仅供参考,如有不足之处&#xff…

大模型-attention汇总解析之-GQA

从上面的图可以看出,MHA是一个attention 头有自己独立的kv cache 缓存,这样子的计算效果是最好的,同时kv cache 也是最完善的,意味着也是最占用内存的。MQA 进行了极致的kv cache 共享,那么能不能对多头进行分组&#…

Haption在危险、挑战性或受限环境中操作的情况提供了一种创新的遥操作解决方案

Haption Virtuose 6D TAO是一款拥有7个主动自由度的触觉设备,专为虚拟现实环境交互而设计。 它与Virtuose的一系列软件解决方案兼容,可让您直接在CAD软件中使用该设备进行装配仿真,并在3D游戏引擎中使用该设备,从而打造更加逼真的…

[STM32问题解决(2)]STM32通过串口与PC通信,打开串口助手后无法在打开状态下下载程序和复位STM32

问题回顾 最近学习STM32单片机,经常使用STM32通过USART1串口与PC的串口助手进行通信。为了简单便捷,通常在打开串口的状态下下载程序。这样子下载程序后,STM32发出的信号,PC马上可以收到。 但是,突然出现了一个问题&a…

JVM内存模型(运行时数据区)

目录 编者想说 1、内存模型图 2、栈 3、程序计数器 3、堆 4、方法区(元空间) 5、本地方法栈(Native Method Stack) 编者想说 通过上一篇文章的对JVM的体系结构以及它的演化,我们对JVM有了一个比较清晰的认识&…

突破铁芯CT局限:罗氏线圈的“无磁饱和”技术深度解读

罗氏线圈互感器:关键应用场景解析 罗氏线圈(Rogowski Coil)互感器以其独特的性能优势,成为测量交流电流(尤其适用于变化快、幅度大或频率范围广的电流)的理想选择。其核心优势在于宽频带、无磁饱和、尺寸灵…

Oracle数据仓库在医院的应用场景

2025年3月28日,我作为会议组织者,在宁波组织了数据仓库在医院的应用场景,会议主要议题如下: 1、解析医院多源异构数据(HIS/LIS/EMR/PACS)实时整合的技术方案 2、Oracle exadata在构建全院级数据仓库的性能优…

JavaScript引用类型

引用类型概述 变量值的两种存储方式 1原始值 2引用值 基本数据类型 5种基本数据类型都是按照原始值的方式来存储的,也叫原始数据类型。 undefined表示没有存储值,也是一种基本数据类型;null表示存储了值,但是空指针&#xff…

实战项目7(10)【待更新......】

任务场景一 按照下图完成网络拓扑搭建和配置 任务要求: 按照以上网络拓扑,将直连路由重发布至OSPF动态路由信息中,实现终端PC间可以正常访问。 【R1】配置 【R2】配置 【R3】配置 任务场景二 按照下图完成网络拓扑搭建和配置 任务要求&…

C# 将HTML文档、HTML字符串转换为图片

在.NET开发中,将HTML内容转换为图片的需求广泛存在于报告生成、邮件内容存档、网页快照等场景。Free Spire.Doc for .NET作为一款免费的专业文档处理库,无需Microsoft Word依赖,即可轻松实现这一功能。本文将深入解析HTML文档和字符串转图片两…

MySql(八)

目录 查询 1)准备一张表 2)准备数据 3)查询表中的数据 4)只查表中的某些列 5)为列起别名 使用 as 不使用as 查询 1)准备一张表 CREATE table role( roleid INT PRIMARY KEY AUTO_INCREMENT, rolename VA…

Redis Sorted Set 深度解析:从原理到实战应用

Redis Sorted Set 深度解析:从原理到实战应用 在 Redis 丰富的数据结构家族中,Sorted Set(有序集合)凭借独特的设计和强大的功能,成为处理有序数据场景的得力工具。无论是构建实时排行榜,还是实现基于时间的…

95套HTML高端大数据可视化大屏源码分享

概述​​ 在大数据时代,数据可视化已成为各行各业的重要需求。这里精心整理了95套高端HTML大数据可视化大屏源码,这些资源采用现代化设计风格,可帮助开发者快速构建专业的数据展示界面。 ​​主要内容​​ ​​1. 设计风格与特点​​ 采用…

Python 中的空间 KDE 图

数据:布里斯班致命车祸 我将使用昆士兰道路车辆事故数据集,该数据集可从昆士兰开放数据门户获取。该数据集提供了昆士兰州2001年1月1日至2023年11月30日期间所有已报告的道路交通事故的地点和特征信息。 我只想关注致命事故,所以唯一需要关…

变焦位移计:机器视觉如何克服人工疲劳与主观影响?精准对结构安全实时监测

变焦视觉位移监测与人工监测的对比 人工监测是依靠目测检查或借助于全站仪,水准仪,RTK等便携式仪器测量得到的信息,但是随着整个行业的发展,传统的人工监测方法已经不能满足监测需求,从人工监测到自动化监测已是必然趋…

【JavaWeb】Maven、Servlet、cookie/session

目录 5. Maven6. Servlet6.1 Servlet 简介6.2 HelloServlet6.3 Servlet原理6.4 Mapping( **<font style"color:rgb(44, 44, 54);">映射 ** )问题6.5 ServletContext6.6 HttpServletResponse<font style"color:rgb(232, 62, 140);background-color:rgb(…

【Day40】

DAY 40 训练和测试的规范写法 知识点回顾&#xff1a; 彩色和灰度图片测试和训练的规范写法&#xff1a;封装在函数中展平操作&#xff1a;除第一个维度batchsize外全部展平dropout操作&#xff1a;训练阶段随机丢弃神经元&#xff0c;测试阶段eval模式关闭dropout 作业&#x…

GEARS以及与基础模型结合

理解基因扰动的反应是众多生物医学应用的核心。然而&#xff0c;可能的多基因扰动组合数量呈指数级增长&#xff0c;严重限制了实验探究的范围。在此&#xff0c;图增强基因激活与抑制模拟器&#xff08;GEARS&#xff09;&#xff0c;将深度学习与基因-基因关系知识图谱相结合…

【C++】入门基础知识(1.5w字详解)

本篇博客给大家带来的是一些C基础知识&#xff01; &#x1f41f;&#x1f41f;文章专栏&#xff1a;C &#x1f680;&#x1f680;若有问题评论区下讨论&#xff0c;我会及时回答 ❤❤欢迎大家点赞、收藏、分享&#xff01; 今日思想&#xff1a;微事不通&#xff0c;粗事不能…