Det kan ikke gå ned

Med undskyldning til tidligere kolleger: Når nogen siger til mig at et system ikke kan gå ned (endda både sagt og skrevet klart og tydeligt og med store bogstaver) så tænker jeg at de ikke ved hvad de taler om.

Jo mere de insisterer jo mere tænker jeg at de direkte taler usandt. Det er ligesom den gamle lære om at tale højere når argumentet er svagt.

Twitter’s “Fail Whale” er en af mine favoritter. Twitter ved at systemet kan være nede og derfor skal brugerne orienteres. Historien viser også at de har kunnet håndtere det internt.

I et tidligere arbejde er jeg for eksempel blevet fortalt at en firewall ikke kunne gå ned (gæt selv hvad der skete) og der derfor ikke var behov for have en reserve på lader, at backupsystemet med sikkerhed kunne reetablere vores data (efter 11 (elleve!) forskellige systemer afprøvet over 6 år lykkedes det) og til sidst at en SAN giver 100% oppetid (gæt igen). Skal jeg være helt fair er der ikke nogen af dem jeg har arbejdet tæt sammen med der har påstået disse ting men jeg har måttet indrette mit arbejde efter at taktikken har været sådan.

Det interessante ved et systems nedbrud er, ud over at begrænse dem, naturligvis at sørge for at når nedbruddet kommer at konsekvenserne kan håndteres. Jo flere ting der bliver styret af automatiske eller autonome systemer jo vigtigere bliver dette.

This entry was posted in Security and tagged , . Bookmark the permalink.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.