S4F4: I2P-Inproxy und SSL-Server

Überwachung meldet Fehler. Pingt noch, sonst aber passiert fast nichts mehr. Das ist der zweite Fall in Folge.

Maschine reagiert nach endlosen Zeiten auf HTTP. SSH-Login kommt aber auch nach einiger Zeit nicht. Aus unbekannten Gründen ist die Maschine unter irgendwelchem Feuer. Evtl. hat wieder jemand einen Dreh gefunden, die Maschine zu überlasten, oder ich habe einen Bug erfunden, der die Maschine regelmäßig killt.

Fazit: Ich muss mir zu der Kiste einen SSH offenhalten um etwas tun zu können wenn das passiert um schneller reagieren zu können.

Vermutung

Der RAM geht zur Neige, es wird unendlich viel geswappt, die Festplatte gerät ins Thrashing und so gut wie nichts geht mehr. Beim ersten Mal ist der Load auf über 800(!) hochgegangen, das bedeutet, irgendein Prozess hat geforkt wie wahnsinnig. Leider bekomme ich das nur heraus, wenn ich mich einloggen kann, was momentan ja leider nicht geht.

Maßnahmen

  • Monitoring nun minütlich, liefert mir hoffendlich einen besseren Load
  • Permanenten Login von einer anderen Maschine

Output der Überwachung

20080415-142315+0 ERR
WARN hamburg061.server4you.de I2P inproxy 70/104/379 poor: 5 (5-5)
OK hamburg061.server4you.de I2P procs 7
OK hamburg061.server4you.de I2P router2 0.6.1.33-0 up 7h 7355/91905 OK
OK hamburg061.server4you.de I2P version 0.6.1.33-0 up 7h 18918/56346 OK
OK hamburg061.server4you.de fs / 3700.812M/36.095G 4590.398K/4694.812K ext3
OK hamburg061.server4you.de fs /boot 41.446M/91.12M 23.474K/23.531K ext2
OK hamburg061.server4you.de service SMTP 2+3-0 avg=5 max=6
OK hamburg061.server4you.de service web443 HTTP/1.1 200 OK
OK hamburg061.server4you.de service web80 HTTP/1.1 302 Found
OK hamburg061.server4you.de system free mem[MB]:394/760 files:20260/25000
OK hamburg061.server4you.de system time offset 0.073289
OK hamburg061.server4you.de system uptime 5d 23:54:14, 5/789 proc,   2:10pm  up 5 days 21:53,  0 users

Interessanterweise kommen hin und wieder einige Statusmeldungen von der Maschine beim Monitoring an, aber der poststat.sh hängt.

Aktionen (MESZ)

  • 14:52 Software Reboot angefordert
  • 14:54 Software-Reboot hat nicht gewirkt, Hardware-Reboot angefordert.
  • 14:56 Maschine pingt wieder
  • 15:00 Manuelle Aktion: Webserver angefahren (er hat ein SSL-Zertifikat mit Passphrase)

Seltsames Syslog-Meldungen

May 15 14:13:31 hamburg061 sendmail[1378]: rejecting connections on daemon Daemon0: load average: 12
..
May 15 14:46:53 hamburg061 sendmail[1378]: rejecting connections on daemon Daemon0: load average: 696

May 15 14:21:20 hamburg061 named[1622]: Err/TO getting serial# for "internet-versorger.biz"
May 15 14:21:46 hamburg061 named[1622]: Err/TO getting serial# for "auth-o-mat.com"
May 15 14:22:02 hamburg061 named[1622]: Err/TO getting serial# for "notrechenzentrum.de"

May 15 14:43:40 hamburg061 named[1622]: drained 130 queries (delay 153 sec)