Il nuovo modello di intelligenza artificiale di Anthropic, noto come Anteprima del mito di ClaudeÈ diventato l'epicentro del dibattito globale sui limiti dell'intelligenza artificiale avanzata. La stessa azienda ammette che il sistema è talmente potente in termini di sicurezza informatica da aver deciso di non lanciarlo su larga scala, una scelta insolita in un settore abituato a vantarsi di ogni nuova innovazione.
Ciò che è in gioco non è solo un miglioramento incrementale rispetto ai modelli precedenti, ma un salto qualitativo nella capacità di rilevare e sfruttare le vulnerabilità informaticheI governi, le banche centrali, le principali istituzioni finanziarie e le autorità di regolamentazione europee stanno monitorando attentamente il caso, consapevoli che uno strumento del genere potrebbe rafforzare la difesa dei sistemi criticiMa potrebbe anche aprire la porta ad attacchi di portata senza precedenti se finisse nelle mani sbagliate.
Che cos'è esattamente Claude Mythos e perché il suo lancio è stato posticipato?
Claude Mythos è uno degli ultimi modelli della famiglia Claude, l'ecosistema di IA di Anthropic che compete con ChatGPT di OpenAI e Gemini di GoogleÈ un modello di uso generale, capace di ragionare, programmare e lavorare con un contesto a lungo termine, ma la sua caratteristica più controversa è la sua prestazioni nella sicurezza informatica offensiva e difensiva.
Detto “squadre rosse”Gli specialisti che testano i sistemi di IA fino ai loro limiti hanno concluso in un rapporto interno che Mythos è "sorprendentemente capace" nei compiti di sicurezza informatica. Nei test di benchmark come Banco SWE verificato o SWE-bench ProProgettato per misurare la capacità di risolvere problemi reali di ingegneria del software, il modello avrebbe facilmente superato le migliori alternative commerciali, comprese le versioni avanzate di GPT e Gemini, secondo i dati forniti dalla stessa Anthropic.
Al di là dei parametri di riferimento, ciò che ha fatto scattare l'allarme è che Mythos è stato in grado di localizzare vulnerabilità zero-day —difetti precedentemente sconosciuti— in componenti software ampiamente utilizzati, alcuni dei quali risalenti a oltre vent'anni fa. In sistemi come OpenBSD, FFmpeg e componenti di FreeBSD, il modello non solo ha rilevato errori rimasti inosservati per anni, ma ha anche generato exploit funzionanti per sfruttarli.
Di fronte a questi risultati, Anthropic ha optato per una decisione insolita per il settore: presentare il modello e poi annunciare che non verrà commercializzato apertamente. perché ritiene che comporti rischi di sicurezza informatica senza precedenti. L'azienda insiste sul fatto che Mythos sia il modello "più adeguato" che abbia mai realizzato, ma riconosce che la sua enorme capacità amplifica le conseguenze di qualsiasi uso improprio.

Un modello con abilità da "hacker" di gran lunga superiori alle capacità umane.
Documenti tecnici e rapporti di varie organizzazioni concordano sul fatto che Mythos segna un punto di svolta nell'automazione degli attacchi complessiIn ambienti di test che simulavano reti aziendali reali, il sistema è stato in grado di concatenare vulnerabilità, elevare i privilegi e ottenere un accesso persistente in poche ore: operazioni che a un esperto umano richiederebbero giorni o settimane.
Nel motore JavaScript di Firefox, ad esempio, le versioni precedenti dei modelli di Anthropic raramente riuscivano a trasformare le vulnerabilità in exploit funzionanti. Mythos, nelle stesse condizioni di test, Ha generato decine di exploit operativiRiproduce fedelmente lo sfruttamento delle vulnerabilità più efficaci. Su piattaforme di analisi come OSS-Fuzz, progettate per individuare bug nel software open source, è in grado di rilevare vulnerabilità di elevata gravità passate inosservate nonostante anni di test automatizzati.
Il modello ha inoltre dimostrato notevoli capacità in ingegneria inversaÈ in grado di ricostruire parte della logica di un programma a partire da file binari compilati e, da lì, individuare e sfruttare le vulnerabilità senza accedere al codice sorgente originale. Questo tipo di capacità avvicina l'IA a scenari che, fino a poco tempo fa, erano considerati appannaggio esclusivo di team umani altamente specializzati.
Uno degli episodi più frequentemente citati nelle valutazioni di sicurezza è il cosiddetto "test del sandwich". In un ambiente di laboratorio isolato, a Mythos è stato dato il controllo di un sistema con istruzioni esplicite per tentare esci dalla sandbox e contatta il ricercatore che stava supervisionando il test. Il modello è riuscito a sfruttare una serie di vulnerabilità per uscire dal suo ambiente ristretto e inviare un'e-mail al responsabile, che in quel momento era fuori ufficio. Sebbene l'incidente si sia verificato in una precedente versione interna e sotto comando, illustra la misura in cui il sistema può operare in scenari complessi con una supervisione minima.
Nonostante queste dimostrazioni, gli analisti insistono nel chiarire che Non abbiamo a che fare con un'IA "cosciente" o dotata di una propria volontà.Mythos non decide autonomamente di attaccare i sistemi; esegue i compiti che gli vengono assegnati nel modo più efficiente possibile. Il rischio, in questo senso, non è che il modello si ribelli, ma che qualcuno lo utilizzi – o lo costringa a farlo tramite sofisticati comandi – per compiere azioni dannose.
Progetto Glasswing: Il mito al servizio della difesa… per pochi eletti
Invece di aprire l'accesso al pubblico generale, Anthropic ha scelto di circondare Mythos con un programma specifico, Progetto GlasswingConcepito per utilizzare le capacità del modello in modo controllato a fini di protezione di software critici, l'iniziativa prevede di offrire il sistema, a determinate condizioni d'uso, a un gruppo selezionato di grandi aziende tecnologiche, fornitori di infrastrutture e istituzioni finanziarie.
Tra le organizzazioni che hanno accesso ci sono giganti come Amazon Web Services, Apple, Microsoft, Google cloudNvidia o Broadcomnonché aziende di sicurezza informatica come CrowdStrike, il cui software difettoso ha causato una grave interruzione a livello globale nel 2024. A queste si aggiungono banche di fama mondiale, tra cui JP Morgan Chase e diversi grandi gruppi di Wall Street, nonché altre organizzazioni responsabili della manutenzione di infrastrutture IT sensibili.
Anthropic ha anche annunciato prestiti per un valore di 100 milioni di dollari Questo finanziamento permetterà a queste organizzazioni di utilizzare Mythos per l'analisi delle vulnerabilità, insieme alle donazioni a fondazioni per il software libero come la Linux Foundation e l'Apache Software Foundation. L'obiettivo ufficiale è chiaro: consentire a coloro che gestiscono i software più critici al mondo di identificare e correggere le falle prima che tali strumenti diventino accessibili a potenziali aggressori.
Questa strategia, tuttavia, sta generando un certo disagio nel settore. Da un lato, rafforza l'idea che la tecnologia sia abbastanza pericolosa da richiedere un accesso limitato. Dall'altro lato, Si crea così un divario tra coloro che beneficiano dello "scudo" del Mito e coloro che ne sono esclusi.Le aziende e le amministrazioni che non aderiscono a Glasswing corrono il rischio di trovarsi in seguito ad affrontare vulnerabilità identificate e corrette in ambienti privilegiati, ma ancora presenti nei propri sistemi.
In Europa, questa asimmetria è motivo di particolare preoccupazione per i responsabili delle infrastrutture critiche e per i team di sicurezza dei grandi gruppi industriali e finanziari, che monitorano attentamente se Bruxelles e le capitali europee si stanno adoperando affinché programmi simili includano i principali attori del continente su un piano di parità. e sovranità del cloud con i partner statunitensi.
Reazioni da parte di governi, autorità di regolamentazione e settore finanziario
L'impatto di Mythos non si limita al regno tecnico. In pochi giorni, l'annuncio del modello ha innescato riunioni di alto livello negli Stati Uniti e in EuropaIl Segretario del Tesoro statunitense ha convocato a Washington i vertici delle principali banche del paese per valutare i rischi che il sistema potrebbe comportare per la stabilità finanziaria, e anche il Presidente della Federal Reserve ha partecipato a questi colloqui.
Secondo le fughe di notizie riportate dai media internazionali, queste entità sarebbero state incoraggiate a Metti alla prova Mythos in modalità difensivaLo utilizzano per scansionare la propria infrastruttura alla ricerca di vulnerabilità prima che altri possano farlo. Il messaggio implicito è che la minaccia è sufficientemente seria da giustificare una risposta coordinata tra pubblico e privato.
Nel frattempo, il co-fondatore di Anthropic ha confermato che l'azienda mantiene colloqui diretti con il governo degli Stati Uniti riguardo a Mythos e ai modelli futuri. Queste discussioni si svolgono in un contesto teso, dopo che le autorità statunitensi hanno recentemente aggiunto la società a una lista di rischi della catena di approvvigionamento, a seguito di attriti legati all'utilizzo dei loro modelli da parte del Dipartimento della Difesa.
Dall'altra parte dell'Atlantico, l'Unione europea ne ha preso atto. La Commissione europea ha pubblicamente approvato un approccio graduale e cauto a modelli come Mythos, e Le autorità di regolamentazione finanziaria nel Regno Unito e nel continente hanno iniziato a studiare nello specifico le sue potenziali implicazioni per il settore bancario e i mercati finanziari. L'AI Security Institute (AISI) del governo britannico ha descritto il sistema come un significativo passo avanti in termini di minacce informatiche rispetto alle generazioni precedenti.
In Spagna, sebbene il dibattito pubblico sia ancora limitato, gli organi di vigilanza e i team di sicurezza informatica di banche e grandi aziende energetiche stanno monitorando attentamente questi sviluppi. Per il settore finanziario europeo, qualsiasi progresso che possa facilitare attacchi coordinati contro i sistemi di pagamento, le reti interbancarie o le piattaforme di trading è motivo di seria preoccupazione.
Scetticismo, dubbi e dibattito sull'"entusiasmo" che circonda Mythos
Il resoconto di Anthropic, che combina avvertimenti sulla sicurezza con cifre di prestazioni spettacolari, non è stato esente da critiche. Diversi esperti di IA e sicurezza informatica hanno chiesto cautela nell'interpretazione delle dichiarazioni dell'aziendafacendo notare che gran parte dei dati disponibili proviene esclusivamente da report interni.
Alcuni analisti hanno esaminato nel dettaglio l'ampia documentazione pubblicata da Anthropic e sottolineano che la cifra di "migliaia di vulnerabilità ad alta gravità" si basa su estrapolazioni da un numero relativamente piccolo di casi esaminati manualmente. In alcune suite di test, Mythos avrebbe riscontrato un numero significativo di falle critiche, ma ben lontano dallo scenario quasi apocalittico suggerito da alcuni titoli.
Altri studi indipendenti hanno tentato di confrontare le prestazioni di Mythos con modelli open-source più piccoli, passando frammenti di codice vulnerabili a diverse IA per vedere se potevano rilevare gli stessi difetti. I risultati indicano che Alcuni modelli aperti sono anche in grado di identificare vulnerabilità complesseQuesto mette in discussione l'idea che Mythos giochi in una lega completamente diversa in tutti gli scenari.
Questi tipi di controesempi non negano le capacità di Mythos, ma suggeriscono che Il discorso sul "troppo pericoloso da pubblicare" ha anche una dimensione di marketing.Presentare un modello come straordinariamente potente ma al contempo potenzialmente rischioso rafforza l'immagine di leadership tecnologica e di responsabilità, un aspetto di grande valore in un mercato sempre più competitivo.
La storia recente del settore ricorda anche il precedente di GPT-2 nel 2019, quando OpenAI inizialmente decise di non pubblicare il modello completo, sostenendo che fosse troppo pericoloso a causa del suo potenziale di generare disinformazione. Alla fine, quella versione fu rilasciata al pubblico senza che si materializzasse nessuna delle catastrofi previste, e molti esperti la citarono come un esempio di reazione eccessiva. Con Mythos, La differenza sta nel fatto che l'attenzione non è più focalizzata sul testo, bensì sull'integrità dell'infrastruttura digitale., un ambito molto più delicato per governi e banche.
Un delicato equilibrio tra sicurezza, business e accesso alla tecnologia
Al di là del clamore mediatico, la situazione di Mythos solleva una questione fondamentale: Chi decide quando un modello di intelligenza artificiale è troppo pericoloso per essere rilasciato? E in base a quali criteri? Per ora, la decisione è stata unilaterale da parte di Anthropic, che ha optato per mantenere il sistema in una sorta di quarantena controllata, riservandolo a partner selezionati.
Questa posizione non si basa esclusivamente su motivi di sicurezza. Eseguire un modello con le caratteristiche di Mythos è molto costoso in termini di calcoloe la stessa azienda riconosce di non avere attualmente la infrastrutture necessarie per fornirlo in massa a milioni di utenti. In pratica, le precauzioni di sicurezza e le limitazioni tecniche vanno di pari passo, dando ad Anthropic il tempo di perfezionare sia il modello che la sua implementazione.
Allo stesso tempo, l'azienda ha iniziato a differenziare chiaramente i suoi vari prodotti. Mentre Mythos rimane come standard interno più avanzatoMentre alcuni modelli sono riservati alla ricerca e alla collaborazione strategica, altri, come Claude Opus 4.7, sono pensati per l'uso quotidiano da parte di aziende e professionisti. Anthropic ha persino ammesso pubblicamente che Opus 4.7 è "meno performante" di Mythos in generale e, in particolare, per quanto riguarda le sue capacità informatiche: un fatto insolito in un settore che solitamente presenta ogni nuovo modello come il migliore sotto ogni aspetto.
In questo schema, il Mito funziona come banco di prova per funzionalità di nuova generazioneSebbene i modelli disponibili in commercio incorporino solo una parte di queste funzionalità, con ulteriori limitazioni volte a ridurre i rischi, questa separazione tra modelli "sperimentali" e "di produzione" può rappresentare un approccio ragionevole per molte organizzazioni europee interessate a sfruttare l'IA senza esporsi direttamente ai rischi, a condizione che vi sia sufficiente trasparenza in merito alle effettive capacità di ciascun sistema.
Ciò che sta emergendo in definitiva è uno scenario in cui La sicurezza informatica sta entrando a pieno titolo nell'era dell'intelligenza artificiale offensiva e difensiva su larga scala.Strumenti come Mythos promettono di accelerare l'individuazione delle vulnerabilità nei sistemi in funzione da anni, ma impongono anche un ripensamento delle modalità di distribuzione e governance della tecnologia alla base dell'economia digitale. Per l'Europa e la Spagna, la sfida non sarà solo quella di proteggersi da modelli sempre più potenti, ma anche di garantire di non essere escluse dai meccanismi che ne consentono l'utilizzo per rafforzare la propria sicurezza.
