240px-Diamond warning sign (Vienna Convention style).svg.png Content of this wiki is DEPRECATED 240px-Diamond warning sign (Vienna Convention style).svg.png

Servery nms

Z old-wiki.siliconhill.cz
(Rozdíly mezi verzemi)
Přejít na: navigace, hledání
Řádka 49: Řádka 49:
 
== Dostupnost serverů ==
 
== Dostupnost serverů ==
 
* Dostupnost serverů se ověřuje pomoci ICMP pingu.
 
* Dostupnost serverů se ověřuje pomoci ICMP pingu.
* Seznam monitorovaných serverů: [servers_and_services.odt]
+
* Seznam monitorovaných serverů: [xls]
  
 
== Dostupnost služeb ==
 
== Dostupnost služeb ==
 
* Monitorování dostupnosti TCP/UDP služeb je zabezpečen pomocí požadavků na daný TCP/UDP port a kontrolou bežíciho procesu
 
* Monitorování dostupnosti TCP/UDP služeb je zabezpečen pomocí požadavků na daný TCP/UDP port a kontrolou bežíciho procesu
* Seznam ověřovaných služeb:
+
* Seznam ověřovaných služeb: [xls]
 +
 
 +
= Performnce monitoring =
 +
* Zátež CPU (load)
 +
* Vyuziti pameti
 +
* Mereni teplot
 +
* Chybovost sitovych interfacu
 +
* Stav baterie APC
 +
 
 +
= Severity =
 +
* Information
 +
* Warning
 +
* Average
 +
* High
 +
* Disaster
 +
 
 +
= Notifikace =
 +
Notifikace sou rozesílane emailem pres smtp server service.sh.cvut.cz na adresu $server@sh.cvut.cz a přez GSM modul formou SMS (zatim neimplementovano).
 +
 
 +
== Format email notifikace ==
 +
<pre>
 +
Head>To: $HOSTALIAS@sh.cvut.cz
 +
Head>From: nms@sh.cvut.cz
 +
Head>Subject: $HOSTALIAS - $ALARMTYPE
 +
Body>Notification Type: $NOTIFICATIONTYPE$
 +
Body>Host: $HOSTALIAS$
 +
Body>State: $HOSTSTATE$ for $HOSTDURATION$
 +
Body>Alarmtype: $ALARMTYPE
 +
Body>Address: $HOSTADDRESS$
 +
Body>Info: $HOSTOUTPUT$
 +
Body>Date/Time: $LONGDATETIME$
 +
Body>ACK by: $HOSTACKAUTHOR$
 +
Body>Comment: $HOSTACKCOMMENT$
 +
Body>Severity: $SEVERITY
 +
</pre>
 +
 
 +
== Format SMS notifikace ==
 +
* Maximálně 160 znaků.
 +
<pre>
 +
Head>To: $ADMIN_NUMBER
 +
Head>From: $NMS_NUMBER
 +
 
 +
Body>Host: $HOSTALIAS
 +
Body>State: $HOSTSTATE$ for $HOSTDURATION$
 +
Body>Date/Time: $LONGDATETIME$
 +
Body>Alarmtype: $ALARMTYPE
 +
Body>Severity: $SEVERITY
 +
</pre>
  
 
= Informace o serveru nms.sh.cvut.cz =
 
= Informace o serveru nms.sh.cvut.cz =

Verze z 1. 3. 2009, 02:41

Obsah

Obecné informace

NMS je Network monitoring system. Hlavním cílem tohoto serveru je, monitorování dostupnosti a performance veškerého provozu na Strahově.


Cíle

  • performance a alarm monitoring serveru a sitovych prvku

Cílem je prozkoumat, zda je dany spravovaný server aktivní, pokud aktivní je, je vše v pořádku, v opačném případě zašle systém e-mail správci, zástupci a technickému manažerovi. Systém dále zašle SMS správci a jeho zástupci o nekativitě PC.

Monitorované platformy

Switche a routre

  • Cisco Catalyst 6509
  • Cisco 3750
  • Cisco 2950
  • Cisco 2960
  • Cisco Air Ap 1242AG-E-K9

Servery

  • HP Proliant 145 G2
  • HP Proliant DL380 G5
  • Různe x86a x64 servery
  • Dell ???

Jina zarizeni

  • KVM
  • APC Symmetra LX 16kVA

Operacni systemy

  • Debian GNU Linux Lenny
  • Debian GNU Linux 4.0 Etch
  • Debian GNU Linux 3.1 Sarge
  • FreeBSD 6.3
  • Microsoft Windows Server 2003 Standart x64
  • Microsoft Windows Server 2008

Komunikační protokoly vyuzivany k monitoringu

  • ICMP (ping)
  • SNMP (161/UDP)
  • SYSLOG (514/UDP)
  • ZABBIX AGENT (10050/TCP)
  • ZABBIX TRAP (10051/TCP)

Alarm monitoring

Dostupnost sítovycg zarizeni

  • Monitorovaní stavu portů u jednotlivých propojů na páteři a blocích pomocí syslog správ nebo SNMP trapů
  • Monitorování dostupnosti síťových prvkú pomocí ICMP pingu
  • Seznam síťových prvků a monitorovaných interfaců:[xls]

Dostupnost serverů

  • Dostupnost serverů se ověřuje pomoci ICMP pingu.
  • Seznam monitorovaných serverů: [xls]

Dostupnost služeb

  • Monitorování dostupnosti TCP/UDP služeb je zabezpečen pomocí požadavků na daný TCP/UDP port a kontrolou bežíciho procesu
  • Seznam ověřovaných služeb: [xls]

Performnce monitoring

  • Zátež CPU (load)
  • Vyuziti pameti
  • Mereni teplot
  • Chybovost sitovych interfacu
  • Stav baterie APC

Severity

  • Information
  • Warning
  • Average
  • High
  • Disaster

Notifikace

Notifikace sou rozesílane emailem pres smtp server service.sh.cvut.cz na adresu $server@sh.cvut.cz a přez GSM modul formou SMS (zatim neimplementovano).

Format email notifikace

Head>To:		$HOSTALIAS@sh.cvut.cz
Head>From:		nms@sh.cvut.cz
Head>Subject:	$HOSTALIAS - $ALARMTYPE
Body>Notification Type: $NOTIFICATIONTYPE$
Body>Host: $HOSTALIAS$
Body>State: $HOSTSTATE$ for $HOSTDURATION$
Body>Alarmtype: $ALARMTYPE
Body>Address: $HOSTADDRESS$
Body>Info: $HOSTOUTPUT$
Body>Date/Time: $LONGDATETIME$
Body>ACK by: $HOSTACKAUTHOR$
Body>Comment: $HOSTACKCOMMENT$
Body>Severity: $SEVERITY

Format SMS notifikace

  • Maximálně 160 znaků.
Head>To:		$ADMIN_NUMBER
Head>From:		$NMS_NUMBER

Body>Host: $HOSTALIAS
Body>State: $HOSTSTATE$ for $HOSTDURATION$
Body>Date/Time: $LONGDATETIME$
Body>Alarmtype: $ALARMTYPE
Body>Severity: $SEVERITY

Informace o serveru nms.sh.cvut.cz

  • Operační systém : Debian Linux
  • Hardware : Dell Power Edge
  • Správce : James
  • Zabbixadmin : Netopier

Software

  • zabbix - activity and performance monitoring
  • cacti - monitoring sitoveho provozu na portech cisco routru

Hostované služby

  • monitoring serverů

Administrátorský (root) přístup na server

Římek Jakub - správce serveru
Leonov Alexander - zabbix admin

Ruzne navody

Nastaveni zabbix agenta

/etc/zabbix/zabbix_agent.conf

Server=147.32.127.234
Timeout=3

/etc/zabbix/zabbix_agentd.conf

Server=147.32.127.234
ServerPort=10051
Hostname=$hostname_serveru.sh.cvut.cz
ListenPort=10050
ListenIP=$ipadresa_serveru
StartAgents=5
Timeout=3
Jmenné prostory

Varianty
Akce