Prometheus入门
输出被监控组件信息的HTTP接口被叫做exporter 。目前互联网公司常用的组件大部分都有exporter可以直接使用,比如Varnish、Haproxy、Nginx、MySQL、Linux系统信息(包括磁盘、内存、CPU、网络等等)。
Prometheus服务过程大概是这样:
Prometheus Daemon负责定时去目标上抓取metrics(指标)数据,每个抓取目标需要暴露一个http服务的接口给它定时抓取。Prometheus支持通过配置文件、文本文件、Zookeeper、Consul、DNS SRV Lookup等方式指定抓取目标。Prometheus采用PULL的方式进行监控,即服务器可以直接通过目标PULL数据或者间接地通过中间网关来Push数据。
Prometheus在本地存储抓取的所有数据,并通过一定规则进行清理和整理数据,并把得到的结果存储到新的时间序列中。
Prometheus通过PromQL和其他API可视化地展示收集的数据。Prometheus支持很多方式的图表可视化,例如Grafana、自带的Promdash以及自身提供的模版引擎等等。Prometheus还提供HTTP API的查询方式,自定义所需要的输出。
PushGateway支持Client主动推送metrics到PushGateway,而Prometheus只是定时去Gateway上抓取数据。
Alertmanager是独立于Prometheus的一个组件,可以支持Prometheus的查询语句,提供十分灵活的报警方式。
Prometheus适用的场景
Prometheus在记录纯数字时间序列方面表现非常好。它既适用于面向服务器等硬件指标的监控,也适用于高动态的面向服务架构的监控。对于现在流行的微服务,Prometheus的多维度数据收集和数据筛选查询语言也是非常的强大。Prometheus是为服务的可靠性而设计的,当服务出现故障时,它可以使你快速定位和诊断问题。它的搭建过程对硬件和服务没有很强的依赖关系。
Prometheus不适用的场景
Prometheus它的价值在于可靠性,甚至在很恶劣的环境下,你都可以随时访问它和查看系统服务各种指标的统计信息。 如果你对统计数据需要100%的精确,它并不适用,例如:它不适用于实时计费系统。
Prometheus官网:https://prometheus.io/
安装Prometheus
Prometheus官方给出了多重部署方案,比如:Docker容器、Ansible、Chef、Puppet、Saltstack等。
Prometheus用Golang实现,因此具有天然可移植性(支持Linux、Windows、macOS和Freebsd)。这里直接使用预编译的二进制文件部署,开箱即用。
- Prometheus安装
这里以Linux系统为例:
1 | $ wget https://github.com/prometheus/prometheus/releases/download/v2.2.1/prometheus-2.2.1.linux-amd64.tar.gz |
其它系统版本可在这里下载:https://prometheus.io/download/
- 验证安装
1 | $ cd /usr/local/prometheus |
- 配置Prometheus
在prometheus目录下有一个名为prometheus.yml
的主配置文件。其中包含大多数标准配置及prometheus的自检控配置,默认配置文件如下:
1 | $ cat /usr/local/prometheus/prometheus.yml |
- 创建用户
这里单独创建一个专门用于运行prometheus的用户,不用root运行程序是一种好习惯。主目录为/var/lib/prometheus
,用作prometheus的数据目录。
1 | $ groupadd prometheus |
- 创建Systemd服务
1 | $ vim /etc/systemd/system/prometheus.service |
- 启动Prometheus
1 | $ systemctl start prometheus |
- 验证Prometheus是否启动成功
1 | $ systemctl status prometheus |
- 访问自带Web
Prometheus自带一个比较简单的Web,可以查看表达式搜索结果、报警配置、prometheus配置,exporter状态等。自带Web默认在http://ip:9090
。
Prometheus本身也是自带exporter的,我们通过请求 http://ip:9090/metrics
可以查看从exporter中能具体抓到哪些数据。
这里以Prometheus本身数据为例,简单演示下在Web中查询指定表达式及图形化显示查询结果。
使用Prometheus监控服务器
上面用Prometheus本身的数据简单演示了监控数据的查询,这里我们用一个监控服务器状态的例子来更加直观说明。
为监控服务器CPU、内存、磁盘、I/O等信息,首先需要安装node_exporter。node_exporter的作用是用于机器系统数据收集。
- 安装node_exporter
node_exporter也是用Golang实现,直接使用预编译的二进制文件部署,开箱即用。
1 | $ wget https://github.com/prometheus/node_exporter/releases/download/v0.15.2/node_exporter-0.15.2.linux-amd64.tar.gz |
- 创建Systemd服务
1 | $ vim /etc/systemd/system/node_exporter.service |
- 启动Node exporter
1 | $ systemctl start node_exporter |
- 验证Node exporter是否启动成功
1 | $ systemctl status node_exporter |
- 修改prometheus.yml,加入下面的监控目标:
Node Exporter默认的抓取地址为http://IP:9100/metrics
1 | $ vim /usr/local/prometheus/prometheus.yml |
prometheus.yml中一共定义了两个监控:一个是监控prometheus自身服务,另一个是监控Linux服务器。这里给个完整的示例:
1 | scrape_configs: |
- 重启Prometheus
1 | $ systemctl restart prometheus |
- 在Prometheus Web查看监控的目标
访问Prometheus Web,在Status->Targets页面下,我们可以看到我们配置的两个Target,它们的State为UP。