百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Ganglia监控安装总结(监控安装工作总结)

myzbx 2025-04-11 02:25 5 浏览

一、ganglia简介:

Ganglia是一个跨平台可扩展的,高 性能计算系统下的分布式监控系统,如集群和网格。它是基于分层设计,它使用广泛的技术,如XML数据代表,便携数据传输,RRDtool用于数据存储和可 视化。它利用精心设计的数据结构和算法实现每节点间并发非常低的。它已移植到广泛的操作系统和处理器架构上,目前在世界各地成千上万的集群正在使用。已 被用来连结大学校园和世界各地,可以处理2000节点的规模。

二、与cacti的比较:

起初,对于为什么非要使用ganglia而不使用cacti,让我很迷惑。不过后来在部署过程中,以及后期的体验中。主要由两点:

1. 部署的方便性。相对于cacti的逐台服务器的添加方式,ganglia类似与nagios的部署方式会更简单,更方便。有利于后期的大规模扩张。

2. 两者的数据获取方式(重点):

a:ganglia本身就是为集群监控进行设计的,这体现在其数据的获取方式(客户端主动推送)以及分层设计(node cluster grid)

b:cacti则是服务端主动去轮循(逐台服务器)这在一定程度上影响了数据的新鲜,以及所能监控节点的数量。

3. 通信方式以及冗余:

a:cacti属于点到点通信,并且不会在本地对信息进行存储。存在单点故障的风险

b:ganglia通过组播进行数据交互,配置得当,可以实现冗余避免单点故障。另外,同样由于组播,数据可以在客户机本地进行存放的(安装rrdtool)。

三、Ganglia体系结构:

Ganglia系统组成:

gmetad: 从监听节点轮询出数据,并对数据进行聚合、存储(ganglia组件)

gmond: 组播包的发送和接受。发送本地信息,接受其他节点信息(ganglia组件)

Ganglia网页:提供ganglia的访问页面(ganglia组件)

rrdtool: 数据存储以及提供画图功能

Apache与php:网站功能,对ganglia提供的网页进行解析。

Ganglia工作原理:(网上找了一张图)

上图是描述在一个cluster环境中,数据的采集,传送,处理,存储,以及展示过程

1. 客户端数据的采集是通过gmond这个进程(端口8649)实现的。然后会将数据以xml的格式发送到一个组播地 址(默认是239.2.11.71 这个是可以更改的)

2. 由于在监控端也会有一个gmond进程,所以该进程会收到所有node发出的数据。(XML)

3. Gmetad进程是server进程。运行时将开启两个端口(8651与8652)

其中8651负责在监听地址上面收集gmond数据(填写本地IP即可配置后面说注)

其中8652负责数据的聚合,以及在rrd中的存储(这里有个问题不懂,最后描述)

4. 当通过浏览器访问的时候,php对ganglia的网页进行解析,rrdtool画图。从而将监控 结果进行展示。

四、安装环境:

操作系统:CentOS 6.2 64位

采用LNMP架构(Mysql可以不用,暂时用不上)

五、Ganglia安装:

Server安装:

Mysql安装:

http://dev.mysql.com/get/Downloads/MySQL-5.5/mysql-5.5.28.tar.gz/from/http://cdn.mysql.com/

cmake安装:yum install cmake

编译参数:

cmake . -DCMAKE_INSTALL_PREFIX=/home/mysql-DMYSQL_DATADIR=/var/lib/mysql/ -DSYSCONFDIR=/etc -DDEFAULT_CHARSET=utf8 -DDEFAULT_COLLATION=utf8_general_ci

make && make install

cd /home/mysql

cp./support-files/my-huge.cnf /etc/my.cnf

cp./support-files/mysql.server /etc/init.d/mysqld

chmod +x /etc/init.d/mysqld

Nginx安装:

下载Nginx及相关包

$wget 121.14.129.199:8000/nginx-1.2.1_m.tar.gz

$wget 121.14.129.199:8000/pcre-8.20.tar.gz

依赖包:yum install zlib zlib-devel openssl openssl-devel pcre pcre-devel

解压

$tar xzf nginx-1.2.1_m.tar.gz

$tar xzf pcre-8.20.tar.gz

编译参数

$

./configure --prefix=/home/nginx --with-pcre=../pcre-8.20--without-http_charset_module --without-http_ssi_module--without-http_userid_module --without-http_auth_basic_module--without-http_autoindex_module --without-http_geo_module--without-http_map_module --without-http_empty_gif_module--without-http_browser_module --without-http_upstream_ip_hash_module--with-http_stub_status_module

编译

$make && make install

配置文件

配置文件nginx.conf和common.conf从现网机器上copy一份过来,修改相应配置如主机域名、IP等等。

测试配置文件:$/home/nginx/sbin/nginx –t

Reload:$/home/nginx/sbin/nginx –s reload

PHP安装:

下载地址:
http://www.51osos.com/uploads/soft/libmcrypt-2.5.8.tar.gz

http://php.net/get/php-5.4.3.tar.gz/from/cn2.php.net/mirror

依赖包:yum -y install libjpeg libjpeg-devel libpng libpng-devel freetype freetype-devel libxml2 libxml2-devel zlib zlib-devel bzip2 bzip2-devel ncurses ncurses-devel curl curl-devel libidn libidn-devel

编译安装libmcrypt:

tar -zxflibmcrypt-2.5.8.tar.gz

./configure

make && makeinstall

编译php参数&安装:

tar -zxf

php-5.4.5.tar.gz

cd php-5.4.5

./configure -prefix=/home/php--with-config-file-path=/home/php/etc --with-mysql=/home/mysql/ --with-mysqli=/home/mysql/bin/mysql_config--with-mysql-sock=/tmp/mysql.sock --with-gd --with-iconv --enable-fpm--with-zlib --enable-libxml --enable-xml --enable-bcmath --enable-shmop--enable-sysvsem --enable-inline-optimization --with-curlwrappers --enable-mbregex--enable-mbstring --with-openssl --enable-pcntl --enable-sockets --with-xmlrpc--enable-zip --enable-soap --enable-session --with-mcrypt --with-curl--enable-gd-native-ttf --without-pear

make && makeinstall

cp php.ini-production/home/php/etc/php.ini

ln -s/home/php/etc/php.ini /etc/php.ini

cp/home/php/etc/php-fpm.conf.default /home/php/etc/php-fpm.conf

cp./sapi/fpm/init.d.php-fpm /etc/init.d/php-fpm

chmod +x/etc/init.d/php-fpm

Rrdtool安装:

$wget -d http://oss.oetiker.ch/rrdtool/pub/rrdtool-1.4.7.tar.gz

$tar xzf rrdtool-1.4.7.tar.gz

cdrrdtool-1.4.7

$./configure --prefix=/usr (放在这里会省很多麻烦)

$make && make install

# Linklib

$ldconfig

Ganglia服务端安装:

Ganglia相关下载:

http://nchc.dl.sourceforge.net/project/ganglia/ganglia%20monitoring%20core/3.4.0/ganglia-3.4.0.tar.gz

http://ncu.dl.sourceforge.net/project/ganglia/ganglia-web/3.5.0/ganglia-web-3.5.0.tar.gz

依赖包安装:yum -y install

apr* libconfuselibconfuse-devel* automake autoconf libtool ncurses-devel libxslt groffpcre-devel pkgconfig

Gmetad 编译参数&安装:

cd ganglia-3.3.7

./configure --sysconfdir=/etc/ganglia --with-gmetad --prefix=/home/ganglia

make && make install

Gmond 编译参数&安装:

cd ganglia-3.3.7

./configure --sysconfdir=/etc/ganglia --prefix=/home/ganglia

make && make install

创建启动脚本:

mkdir /etc/ganglia

cp gmond/gmond.init/etc/rc.d/init.d/gmond

cp gmetad/gmetad.init/etc/rc.d/init.d/gmetad

chkconfig --add gmond && chkconfig gmond on

chkconfig --add gmetad&& chkconfig gmetad on

修改/etc/rc.d/init.d/gmetad和/etc/rc.d/init.d/gmond,分别指定如下参数:

·GMETAD=/home/ganglia/sbin/gmetad

·GMOND=/home/ganglia/sbin/gmond

vim /etc/rc.d/init.d/gmond

将daemon $GMOND 替换成daemon $GMOND--conf=/etc/ganglia/gmond.conf

vim /etc/rc.d/init.d/gmetad 将daemon $GMOND 替换成daemon $GMOND--conf=/etc/ganglia/gmetad.conf

gmond--default_config>/etc/ganglia/gmond.conf 加载Gmond配置

至此大部分工作已经完成。(注意:网上很多资料将配置文件放在了/etc下面。可能版本更新的问题,已经不在那个地方了,而是在/etc/ganglia下面。这个可以在README中看到)

配置文件的更改 gmetad配置文件是/etc/ganglia/gmetad.conf 。修改data_source即可

data_source "NeiMeng Hadoop" 10.101.0.251

Data_source 的值包含两部分 "Cluster名称"(也是一个简单的认证,在一个cluster中的所有node都必须配置为该值)

注:这里是要监听的地址,由于数据是组播,所以每个node都会收集到整个cluster的数据,所以填写本地的一个IP(ganglia使用的IP)就可以了。当然这里也可以将所有node的ip加进来。如果有node的端口不是默认的8649,也可以在这里指定端口IP:port

然后此时启动服务 httpd gmetad gmond 进行访问就会看见监控页面了(当然界面中只有本地)

这里有一项要特别注意:就是当有服务器有多个IP的时候,一定要为其添加一条到组播地址的路由,并指定网卡

route add -net 239.2.11.71 netmask 255.255.255.255 dev eth0 (不用重启网络)

或者添加路由文件

[root@dc01c01ts01 ~]# cat /etc/sysconfig/network-scripts/route-eth0

239.2.11.71 dev eth0

然后重启网络

否则会出现服务器“丢失”或者没有数据的问题。

Client安装:

依赖包安装:yum -y install apr*
libconfuselibconfuse-devel* automake autoconf libtool ncurses-devel libxslt groffpcre-devel pkgconfig

客户端的添加

客户端安装相对简单,只需要拷贝需要的文件即可

由于服务器端,未指定安装路径,故出于方便考虑,拿了一台客户机操作,首先将源码包拷贝至该服务器,命令过程如下:

tar -zxf ganglia-3.0.6.tar.gz

cd ganglia-3.0.6

./configure --prefix=/usr/local/ganglia

make

make install

gmond -t > /etc/gmond.conf

ln -s /usr/local/ganglia/bin/* /usr/bin/

ln -s /usr/local/ganglia/sbin/* /usr/sbin/

然后修改/etc/gmond.conf

cluster {

name = "NeiMeng Hadoop"

将这里的name修改为在gmetad.conf中定义的名字即可。

然后将安装后的程序包,/etc/gmond.conf 、/etc/init.d/gmond 打包然后批量拷贝至其他所有客户端,解压然后做链接即可。或者通过cf同步亦可。

记住:如果有客户端有多个IP,一定要添加路由

gmetad.conf配置:

要将case_sensitive_hostnames 0 设置成case_sensitive_hostnames 1 要不然php无法进入rrds里面的文件目录

#-------------------------------------------------------------------------------

# In earlier versions of gmetad, hostnames were handled in a case

# sensitive manner

# If your hostname directories have been renamed to lower case,

# set this option to 0 to disable backward compatibility.

# From version 3.2, backwards compatibility will be disabled by default.

# default: 1 (for gmetad < 3.2)

# default: 0 (for gmetad >= 3.2)

case_sensitive_hostnames 1

最后就是相关服务的制定:

Chkconfig --add gmond

Chkconf gmond on

Service gmond start

在所有客户机上面执行完这些命令以后,在ganglia的监控页面上面就能看到各个被监控机的状态了。

相关推荐

Django零基础速成指南:快速打造带用户系统的博客平台

#python##服务器##API##编程##学习#不是所有教程都值得你花时间!这篇实战指南将用5分钟带你解锁Django核心技能,手把手教你从零搭建一个具备用户注册登录、文章管理功能的完整...

iOS 17.0 Bootstrap 1.2.9 半越狱来啦!更新两点

这款Bootstrap半越狱工具终于更新,离上一次更新已相隔很久,现在推出1.2.9版本,主要为内置两点功能进行更新,也是提升半越狱的稳定性。如果你正在使用这款半越狱工具的,建议你更新。注意!...

iOS 16.x Bootstrap 1.2.3 发布,支持运行清理工具

本文主要讲Bootstrap半越狱工具更新相关内容。如果你是iOS16.0至16.6.1和17.0系统的,想体验半越狱的果粉,请继续往下看。--知识点科普--Bootstrap...

SpringBoot整合工作流引擎Acticiti系统,适用于ERP、OA系统

今日推荐:SpringBoot整合工作流引擎Acticiti的源码推荐理由:1、SpringBoot整合工作流引擎Acticiti系统2、实现了三级权限结构3、持久层使用了mybatis框架4、流程包...

SpringCloud自定义Bootstrap配置指南

在SpringCloud中自定义Bootstrap配置需要以下步骤,以确保在应用启动的早期阶段加载自定义配置:1.添加依赖(针对新版本SpringCloud)从SpringCloud2020...

Python使用Dash开发网页应用(三)(python网页开发教程)

PlotlyDash开发Web应用示例一个好的网页设计通常都需要编写css甚至js来定制前端内容,例如非常流行的bootstrap框架。我们既然想使用Dash来搭建web应用,很大的一个原因是不熟悉...

Oxygen XML Editor 27.1 中的新功能

OxygenXMLEditor27.1版是面向内容作者、开发者、合作者和出版商的行业领先工具包的增量版本。在27.1版本中,AIPositronAssistant得到了增强,包括用于...

【LLM-多模态】Mini-Gemini:挖掘多模态视觉语言模型的潜力

一、结论写在前面论文提出了Mini-Gemini,一个精简而强大的多模态VLM框架。Mini-Gemini的本质在于通过战略性框架设计、丰富的数据质量和扩展的功能范围,发掘VLM的潜在能力。其核心是补...

谐云课堂 | 一文详解分布式改造理论与实战

01微服务与分布式什么是分布式?首先,我们对上图提到的部分关键词进行讲解。单体,是指一个进程完成全部的后端处理;水平拆分,是同一个后端多环境部署,他们都处理相同的内容,使用反向代理来均衡负载,这种也叫...

基于Abaqus的手动挡换挡机构可靠性仿真

手动挡,也称手动变速器,英文全称为Manualtransmission,简称MT,即用手拨动换挡操纵总成才能改变变速器内的齿轮啮合位置,改变传动比,从而达到变速的目的。家用轿车主要采用软轴连接的换挡...

【pytorch】目标检测:彻底搞懂YOLOv5详解

YOLOv5是GlennJocher等人研发,它是Ultralytics公司的开源项目。YOLOv5根据参数量分为了n、s、m、l、x五种类型,其参数量依次上升,当然了其效果也是越来越好。从2020...

超实用!50个非常实用的PS快捷键命令大全分享

今天,给大家介绍50个非常实用的快捷键命令大全,大家伙都是设计师,关于软件使用那是越快越好啊。一、常用的热键组合1、图层混合模式快捷键:正常(Shift+Option+N),正片叠底(Shif...

Pohtoshop中深藏不露的小技巧(科目一考试技巧记忆口诀看完必过)

邢帅教育ps教程为大家总结了一些Pohtoshop中深藏不露的小技巧,可以帮助到大家在设计时减少不必要的麻烦,提高工作效率哦~~~1.设置网格线保持像素完美不在1:1分辨率下也能保持像素完美,可以...

Ganglia监控安装总结(监控安装工作总结)

一、ganglia简介:Ganglia是一个跨平台可扩展的,高性能计算系统下的分布式监控系统,如集群和网格。它是基于分层设计,它使用广泛的技术,如XML数据代表,便携数据传输,RRDtool用于数据...

谁说Adobe XD做不出好看的设计?那是你没搞懂这些功能

AdobeXD的美化栏具有将设计视图美化的功能,它能使界面设计和原型设计更漂亮、更吸引眼球。美化栏的7个功能包括竖线布局设计、横线布局设计、重复网格、图形大小和位置设置、响应式调整大小、文字美化以及...