I would use collectd instead, it has a much better resolution and scales up (which munin doesnt).<br><br>my 2cents,<br><span class="sg">Ohad</span><br><br><div><span class="gmail_quote">On 9/18/09, <b class="gmail_sendername">Shachar Shemesh</b> &lt;<a href="mailto:shachar@shemesh.biz">shachar@shemesh.biz</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">



  
  

<div dir="ltr" bgcolor="#ffffff" text="#000000"><span class="q">
Hetz Ben Hamo wrote:
<blockquote type="cite">
  <pre>So my question: What do you do in case you have the same scenario?<br>what steps do you take to prevent things like that from happening?<br><br>  </pre>
</blockquote></span>
I would focus less on prevention, and more on diagnostics. I usually
use munin (you can see a live example at
<a href="http://www.hamakor.org.il/munin" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">http://www.hamakor.org.il/munin</a>). It&#39;s great in that it gives you
complete history of almost all relevant parameters, and you can (farily
easily) add your own.<br>
<br>
As for the specific problem you are describing, assuming it repeats
itself, it really depends. For example, if you look at the munin
history and see the load average slowly ascending, then I would run ps
and check for runaway zombies or processes. If the load average jumps
suddenly, I would run cron with something that logs the top ten active
processes.<br>
<br>
Shachar<br>
<br>
<pre cols="72">-- <br>Shachar Shemesh<br>Lingnu Open Source Consulting Ltd.<br><a href="http://www.lingnu.com" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">http://www.lingnu.com</a><br></pre>
</div>

<br>_______________________________________________<br>
Linux-il mailing list<br>
<a onclick="return top.js.OpenExtLink(window,event,this)" href="mailto:Linux-il@cs.huji.ac.il">Linux-il@cs.huji.ac.il</a><br>
<a onclick="return top.js.OpenExtLink(window,event,this)" href="http://mailman.cs.huji.ac.il/mailman/listinfo/linux-il" target="_blank">http://mailman.cs.huji.ac.il/mailman/listinfo/linux-il</a><br>
<br></blockquote></div><br>