<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta content="text/html;charset=ISO-8859-1" http-equiv="Content-Type">
  <title></title>
</head>
<body dir="ltr" bgcolor="#ffffff" text="#000000">
Hetz Ben Hamo wrote:
<blockquote
 cite="mid:41e41e7a0909171233x52405e72o510964e549418033@mail.gmail.com"
 type="cite">
  <pre wrap="">

So my question: What do you do in case you have the same scenario?
what steps do you take to prevent things like that from happening?

  </pre>
</blockquote>
I would focus less on prevention, and more on diagnostics. I usually
use munin (you can see a live example at
<a class="moz-txt-link-freetext" href="http://www.hamakor.org.il/munin">http://www.hamakor.org.il/munin</a>). It's great in that it gives you
complete history of almost all relevant parameters, and you can (farily
easily) add your own.<br>
<br>
As for the specific problem you are describing, assuming it repeats
itself, it really depends. For example, if you look at the munin
history and see the load average slowly ascending, then I would run ps
and check for runaway zombies or processes. If the load average jumps
suddenly, I would run cron with something that logs the top ten active
processes.<br>
<br>
Shachar<br>
<br>
<pre class="moz-signature" cols="72">-- 
Shachar Shemesh
Lingnu Open Source Consulting Ltd.
<a class="moz-txt-link-freetext" href="http://www.lingnu.com">http://www.lingnu.com</a>
</pre>
</body>
</html>