Check_ganglia_metric.

plugin de verificação métrica ganglia para Nagios
Baixe Agora

Check_ganglia_metric. Classificação e resumo

Propaganda

  • Rating:
  • Licença:
  • Freely Distributable
  • Nome do editor:
  • Michael T. Conigliaro
  • Site do editor:
  • http://conigliaro.org

Check_ganglia_metric. Tag


Check_ganglia_metric. Descrição

Plugin Métrico de Ganglia para Nagios Check_ganglia_metric é um plugin Nagios que permite acionar alertas em qualquer ganglia metric.check_ganglia_metric foi fortemente inspirado por vladimir vuksan's check_ganglia_metric.php, mas ele vem com uma série de melhorias.Instalação # pip install check_ganglia_metric ... ou: # Easy_install Check_ganglia_metricglia configurador O seu servidor Nagios e ganglia meta doemon estão sendo executados no mesmo host, você provavelmente precisa editar o seu gmetad.conf para permitir conexões remotas do seu Nagios Server.Para permitir conexões do Nagios-server.example.com:Trusted_Hosts Nagios-Server.Example .com permitir conexões de todos os hosts (provavelmente um risco de segurança): All_Trusted Ontesting no comando linefirst, vamos ver se check_ganglia_metric pode se comunicar com o ganglia meta daemon: check_ganglia_metric.py --gmetad_host = gmetad-server.example.com \ - metric_host = host.example.com --metric_name = cpu_idlestatus OK, CPU Idle = 99,3% | CPU_IDLE = 99,3% ;;;; a mensagem "Status OK" indica que Che ck_ganglia_metric está funcionando. Se você está tendo problemas para o trabalho, tente novamente com registro detalhado habilitado (--verbose) para obter melhor insight sobre o que está indo errado. Agora vamos tentar definir um limite de alerta: Check_ganglia_metric.py --gmetad_host = Gmetad- server.example.com \ --metric_host = host.example.com --metric_name = cpu_idle --crical = 99status crítico, CPU IDLE = 99.6% | CPU_IDLE = 99,6% ;; 99 ;; "Status Se a CPU ociosa for maior que 99. A mensagem" Status Critical "indica que funcionou. Observe que check_ganglia_metric analisa e limiares de acordo com as diretrizes oficiais de desenvolvimento de plugin Nagios.Para ver uma lista completa de opções de linha de comando com breves explicações, execute Check_ganglia_metric com a opção - Opção -Help.Nagios ConfigurationFirst, Crie uma definição de comando: Definir comando {command_name Check_ganglia_metric command_line /usr/bin/check_ganglia_metric.py --gmetad_host = gmetad-server.example.com --metric_host = $ hostaddress $ --metric_name = $ arg1 $ --WARNING = $ arg2 $ - Creat = $ arg3 $} Agora você pode usar o comando acima em suas definições de serviço: Definir serviço {service_description cpu idle - ganglia use some_template check_command Check_ganglia_metric! Cpu_idle! 0: 20! 0: 0 host_name host.example.com} Isso funcionará bem até que algo dê errado Check_ganglia_metric (por exemplo, o arquivo de cache não pode ser lido / escrito para, o ganglia meta daemon não pode ser alcançado, etc.). Nesse ponto, todo serviço que depende de check_ganglia_metric falhará, possivelmente inundar você com alertas. Podemos evitar isso através do uso de dependências de serviço. A primeira coisa que precisamos é uma definição de comando para verificar a idade de um arquivo: definir comando {command_name check_file_age command_line / usr / lib / nagios / plugins / check_file_age -f $ arg1 $ - W $ ARG2 $ -C $ ARG3 $} Próximo, definimos um serviço que verifica a idade do arquivo de cache Check_ganglia_metric. Observe que, para ser verdadeiramente eficaz, este serviço precisa ser verificado pelo menos como (de preferência mais) com freqüência do que todas as outras verificações que dependem do Check_Ganglia_metric: Definir serviço {service_description cache para check_ganglia_metric Use algum_template Check_Command Check_file_age! / Var / lib / Nagios / .Check_ganglia_metric.cache! 60! 120 Host_Name LocalHost Check_Interval 1 MAX_CHECK_ATTEMPTS 1} E finalmente, montamos a dependência de serviço real. Observe que eu habilitei o uso_reegexp_matching em Nagios, que me permite usar expressões regulares em minhas diretivas. Ao adiar "- Ganglia" no final de cada serviço que depende do check_ganglia_metric, posso me salvar muito esforço: Definir ServicedEpendency {Host_Name LocalHost Service_Description Cache para Check_Ganglia_metric Dependent_Host_Name. * Dependent_service_description. * \ - Ganglia $ EXECUTION_FAILURE_CRIITORIA C, P} Agora, se algo der errado com Check_Ganglia_metric, apenas um alerta será enviado sobre o arquivo de cache e todas as verificações de serviço dependentes serão pausadas até que você conserte o problema que causou falhar check_ganglia_metric para falhar. Uma vez que o problema é corrigido, você precisará atualizar o registro de data e hora no arquivo de cache para colocar o serviço "Cache for Check_Ganglia_metric" de volta em um estado OK (que permitirá que as verificações de serviço dependentes continuem): Touch / Var / Var / Lib /nagios/.check_ganglia_metric.cachetips e tricksit é possível obter uma lista completa de hosts e métricas disponíveis, permitindo o log de "mais verbose" (-VV). Como as opções Metric_Host e Metric_name são necessárias, você tem um pouco de um problema "frango e ovo" aqui, mas tudo bem. Basta fornecer alguns dados fictícios. O plug-in fará o erro no final com um erro "host / métrico não encontrado", mas não antes de despejar seu cache: Check_ganglia_metric.py --gmetad_host = gmetad-server.example.com \ --metric_host = dummy --metric_name = requisitos manequim -VV: · Pitão · Nagios. Limitações: · Não funciona com o Python 2.4


Check_ganglia_metric. Software Relacionado