Cloudflare e dintorni: che cosa succede quando Big Tech ci tradisce?

Siti web, app e piattaforme inaccessibili. Per ore. Il motivo? Un problema tecnico di Cloudflare, il «guardiano» di Internet o, se preferite, l'azienda (statunitense) che gestisce fra il 10% e il 20% di tutte le richieste in rete. Il malfunzionamento globale ha messo fuori uso social come X e il re dei chatbot, ChatGPT, oltre a portali di informazione fra cui anche i nostri CdT.ch e TicinoNews.ch. L'interruzione di Cloudflare è arrivata a meno di un mese da un problema simile, occorso ad Amazon Web Services, con disservizi ad Alexa, Snapchat e Microsoft Azure. A luglio del 2024, invece, un aggiornamento difettoso inviato da un'azienda di sicurezza informatica chiamata CrowdStrike aveva paralizzato 8,5 milioni di dispositivi Windows in tutto il mondo, causando danni economici superiori ai 10 miliardi di dollari.
Antonio Carzaniga, professore ordinario e membro fondatore (dal 2004) della Facoltà di scienze informatiche dell'Università della Svizzera italiana, ci aiuta a comprendere che cosa è successo e, soprattutto, quali sono le lezioni da trarre da un simile evento. «Pare che alla radice – esordisce il nostro interlocutore – il problema sia stato causato da una limitazione o un difetto di un sistema software piuttosto che da un picco di traffico». E ancora: «Più in dettaglio, un sistema software che gestisce traffico di rete malevolo (o sospettato tale) ha smesso di funzionare dopo una riconfigurazione di routine perché il numero di regole o comunque di dati forniti al sistema per riconoscere e gestire il traffico malevolo era cresciuto oltre un certo limite. In poche parole, è ancora il solito problema dello sviluppo, dell'ingegnerizzazione e della gestione del software. Un componente ha un difetto o una limitazione più o meno conosciuta che lo fa crollare in certe circostanze impreviste».
Secondo le stime, sono stati colpiti 30 milioni di siti. Tanti, tantissimi. «Cloudflare fa parte dell'infrastruttura della rete» prosegue il professore, entrando nel merito della questione. «È un pilastro essenziale di sostegno a una miriade di altri servizi quali siti e applicazioni web, anche se non è visibile alla maggior parte degli utenti, finché appunto non viene a mancare. Concretamente, Cloudflare è una specie di rete di distribuzione dei contenuti e delle applicazioni, una sorta di rete nella rete, che porta i dati vicino agli utenti in modo che questi non debbano andarseli a prendere dall'altra parte del mondo o comunque subissando la sorgente originale dei contenuti».
A medio e lungo termine, quali potrebbero essere le implicazioni per i clienti di Cloudflare? Ancora l'esperto: «Non credo che ci saranno conseguenze a medio e lungo termine. Il guasto è stato identificato e risolto nel giro di tre ore. Ci sono state comunque ripercussioni a catena che sono andate avanti per un po', ma poi anche quelle si sono stabilizzate o lo faranno. L'unica questione a medio e lungo termine è il rischio sistemico intrinseco nell'uso esclusivo di infrastrutture come Cloudflare».
Detto in altri termini, siamo tanto, troppo dipendenti da Big Tech. «La questione centrale è come mantenere funzionale ed efficiente la rete con tutti i suoi servizi» conclude Carzaniga. «Eventi come questo mettono in luce il rischio dell'affidarsi a un singolo servizio infrastrutturale. Ma la soluzione al problema non è poi così semplice. Non si tratta solo di avere una varietà o una scelta di più fornitori come Cloudflare. Si tratta invece di avere ridondanza. Si potrebbe pensare di usarne due o più contemporaneamente. Ma questo ovviamente costa e comunque non è ovvio come farlo. E poi, comunque, di ridondanza ce n'è anche in un singolo fornitore come Cloudflare. Quindi, il problema è come progettare i sistemi in modo che i singoli componenti siano affidabili e che ci sia ridondanza tra i componenti. È una sfida ma è anche il bello dell'ingegneria».
