Intervista esclusiva

Il down di AWS? Impatti limitati per lo sviluppo del cloud

Massimo Ficagna, Senior Advisor degli Osservatori Digital Innovation del Politecnico di Milano, evidenzia come il tasso di affidabilità di questi servizi sia elevatissimo.

Pubblicato il 07 Mar 2017

Gianluigi Torchiani

errore nel cloud

Anche Internet è vulnerabile, così come uno dei suoi principali operatori che ne garantiscono il funzionamento, vale a dire AWS. Ha fatto il giro del mondo la notizia dell’incidente che negli Stati Uniti ha messo ko alcuni popolari siti. Tra questi Medium, Imgur, Runkeeper, Dropbox, Minecraft, Trello, Tinder, la mail Yahoo e persino Netflix o Expedia. Tutti quanti legati a Amazon Web Services, il maggiore servizio di cloud al mondo, che offre spazio di memoria e potenza di calcolo a migliaia di clienti in tutto il mondo. Il cuore di Aws -S3 – serve oltre mezzo milione di clienti e circa 148 mila siti ha smesso di funzionare poco prima delle 19 italiane dello scorso martedì ed è rimasto “bloccato” per circa tre ore. Circa tre ore dopo l’inizio dei malfunzionamenti, con un tweet, l’account ufficiale ha comunicato che i servizi erano in via di ripristino e, in effetti, lentamente la situazione è tornata alla normalità.

Secondo quanto comunicato poi nei giorni successivi dalla stessa Amazon, tutto è stato determinato dal debugging di un problema all’interno del sistema di fatturazione della piattaforma S3. I tecnici avrebbero dovuto mettere off-line una piccola porzione di server, ma a causa di un comando incorretto è finito offline un numero di server nettamente superiore al previsto. Visto quanto successo, Amazon introdurrà dei meccanismi di salvaguardia aggiuntivi: la rimozione dei server S3 in caso di interventi tecnici sarà meno repentina, mentre la Dashboard di controllo sarà isolata rispetto al resto della piattaforma.

Fin qui la storia dell’incidente; ma che conseguenze potrà avere sullo sviluppo futuro del cloud? Come ha raccontato a Digital4Trade Massimo Ficagna, Senior Advisor degli Osservatori Digital Innovation del Politecnico di Milano, gli impatti dovrebbero essere limitati. «Il cloud è un po’ come l’energia elettrica, che si dà sempre per scontata sin quando non si avverte la mancanza. E proprio come l’elettricità, il cloud è il risultato del lavoro di tecnici e professionisti, oltre che di procedure automatizzate. Quello che è capitato nelle scorse settimane non è altro che un incidente, la classica failure che può interessare qualunque attività umana. Non bisogna dunque fare allarmismi: se ripercorriamo la storia di Amazon possiamo scoprire come il precedente grosso incidente risalisse addirittura al 2012, dunque oltre 4 anni fa. Non solo: se andiamo a ben vedere è stata interessata soltanto una singola region sulle 14 servite da AWS. Questo significa che il tasso di affidabilità del servizio è elevatissimo, del 99,9% periodico. Quello che fa davvero la differenza è che Aws ha nettamente la quota di mercato più grande nel mondo cloud, dunque inevitabilmente le conseguenze e gli impatti di un problema di questo genere sono stati significativi. Anche se i tempi di recupero sono stati davvero minimi».

La ricostruzione dell’incidente fornita dalla multinazionale è ritenuta plausibile dall’esperto del Politecnico di Milano che, piuttosto, si concentra su un altro aspetto sinora poco considerato. Vale a dire che tutti quei servizi e siti impattati dal down dello scorso martedì non si erano attrezzati per fare fronte a un possibile guasto: non avevano cioè ragionato in un’ottica di business continuity, facendo affidamento unicamente sull’infrastruttura di rete di AWS. La cui elevata affidabilità, evidentemente, ha fatto trascurare alle aziende una delle regole d’oro dell’era pre-cloud, vale a dire la necessitò di avere una “copia” dei propri servizi critici.

Alla domanda iniziale, vale a dire sui possibili impatti negativi di questa vicenda, con una riduzione della propensione delle aziende a investire nella nuvola, la risposta di Ficagna è chiara: «Se una risposta di questo tipo ci fosse sarebbe del tutto irrazionale. Il cloud, infatti, aumenta il livello di affidabilità dei servizi. Perché, grazie alle economie di scala proprie del cloud, rende possibile portarsi a casa procedure e servizi migliori rispetto a chi ha pochi server in casa. D’altra parte è chiaro che l’effetto mediatico di questa vicenda potrebbe avere degli impatti psicologici, vedremo come reagirà il mercato. Sicuramente l’incidente che ci fu nel 2012 non ha rallentato l’espansione del cloud, che viaggia a una crescita a doppia cifra, dunque mi aspetto anche da questo incidente un impatto tutto sommato limitato. Il vero impatto, potrebbe essere quello di favorire una maggiore attenzione degli utenti dei servizi cloud agli aspetti della business continuity».

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

Articoli correlati