<div dir="ltr"><div class="gmail_default" style="font-family:tahoma,sans-serif">I can recommend Zabbix, I was never used it on a large network (~30 server most), but i was happy with it.<br><br></div><div class="gmail_default" style="font-family:tahoma,sans-serif">

- you can set the monitoring interval for each item (from 1s -> days)<br></div><div class="gmail_default" style="font-family:tahoma,sans-serif">- samples are stored in the DB, and graphs are plotted only when you need them<br>

</div><div class="gmail_default" style="font-family:tahoma,sans-serif">- have a build in support for SMS and Jabber message alerts.<br></div><div class="gmail_default" style="font-family:tahoma,sans-serif">- works with agent, but also works with SNMP and scripts you can writes.<br>

<br></div><div class="gmail_default" style="font-family:tahoma,sans-serif">note that you'll need to provide enough storage for it.<br>(i think they have the formula or a calculator in there website, which you can use to calculate the storage you'll need )<br>

</div></div><div class="gmail_extra"><br clear="all"><div><div dir="ltr"><b><font face="arial, helvetica, sans-serif">--<br>Rabin</font></b><br></div></div>
<br><br><div class="gmail_quote">On Mon, Jun 16, 2014 at 2:12 AM, Ori Berger <span dir="ltr"><<a href="mailto:linux-il@orib.net" target="_blank">linux-il@orib.net</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

I'm looking for a single system that can track all of a remote server's health and performance status, and which stores a detailed every-few-seconds history. So far, I haven't found one comprehensive system that does it all; also, triggering alarms in "bad" situations (such as no disk space, etc). Things I'm interested in (in parentheses - how I track them at the moment. Note shinken is a nagios-compatible thing).<br>


<br>
Free disk space (shinken)<br>
Server load (shinken)<br>
Debian package and security updates  (shinken)<br>
NTP drift (shinken)<br>
Service ping/reply time (shinken)<br>
Upload/download rates per interface (mrtg)<br>
Temperatures (sensord, hddtemp)<br>
Security logs, warning and alerts e.g. fail2ban, auth.log (rsync of log files)<br>
<br>
I have a few tens of servers to monitor, which I would like to do with one software and one console. Those servers are not all physically on the same network, nor do they have a VPN (so, no UDP) but tcp and ssh are mostly reliable even though they are low bandwidth.<br>


<br>
Please note that shinken (much like nagios) doesn't really give a good visible history of things it measures - only alerts; Also, it can't really sample things every few seconds - the lowest reasonable update interval (given shinken's architecture) is ~5 minutes for the things it measures above.<br>


<br>
Any recommendations?<br>
<br>
Thanks in advance,<br>
Ori<br>
<br>
______________________________<u></u>_________________<br>
Linux-il mailing list<br>
<a href="mailto:Linux-il@cs.huji.ac.il" target="_blank">Linux-il@cs.huji.ac.il</a><br>
<a href="http://mailman.cs.huji.ac.il/mailman/listinfo/linux-il" target="_blank">http://mailman.cs.huji.ac.il/<u></u>mailman/listinfo/linux-il</a><br>
</blockquote></div><br></div>