Nelle scorse ore è stato annunciato che è stato rilasciata la versione 4.5 del nuovo Claude!
In questo articolo ho riassunto i principali punti di novità del nuovo modello di casa Anthropic (alcuni sono molto interessanti), in modo tale da darvi una visione chiara e concisa. Lascerò per ultimo i miei commenti, considerando anche che ad oggi sto testando parallelamente anche Perplexity Pro e Gemini 2.5 Pro. Nonostante sia uno dei modelli che più utilizzo nel quotidiano, questo articolo non è in nessun modo sponsorizzato, in quanto l’obiettivo di questo blog è di riportare le notizie in modo più veritiero ed imparziale possibile.
Le novità
“Claude Sonnet 4.5 è il miglior modello di programmazione al mondo.” è così che inizia l’articolo (https://www.anthropic.com/news/claude-sonnet-4-5) sul blog di Anthropic, ed è chiaro fin da subito quale è l’obiettivo primario di questo modello: lo sviluppo.
Claude Agent SDK
Questa è sicuramente una delle più grandi novità, è stato reso disponibile un SDK per sviluppare applicazioni agentiche con Claude. L’SDK inoltre è lo stesso che viene usato dal team di sviluppo di Anthropic per sviluppare i propri agenti. Qui è presente un breve video di spiegazione di come funziona: Building agents with the Claude Agent SDK
Programmazione per 30 ore consecutive
Su questo punto non ci sono molti dettagli condivisi, ma nel loro annuncio è spiegato che un miglioramento della gestione della memoria e del contesto hanno portato Claude ad eseguire in autonomia 30 ore di sviluppo autonomo, mantenendo il focus sull’obiettivo iniziale senza divagare o prendere strade differenti. La perdita del focus man mano che una discussione con un qualsiasi modello AI progredisce è sempre molto fastidiosa, sono curioso di mettere alla prova il nuovo modello nei prossimi giorni.
Claude Code – Integrazione con Visual Studio Code (finalmente)
Avevo già scritto un articolo su come integrare Claude Code sui vari IDE, ma erano un’integrazione ancora incompleta: Claude sfruttava un terminale (o powershell) nell’IDE di sviluppo per poter parlare con noi.
Con Claude 4.5 hanno finalmente rilasciato un’estensione per Visual Studio Code che si allinea all’esperienza visiva che già abbiamo con altri strumenti quali Github Copilot, Gemini o altri.

Su Visual Studio 2026 invece potremo integrare il nostro modello preferito direttamente in Copilot (tramite chiave API), potremo quindi usarlo direttamente nello strumento, con tutte le agevolazioni ed integrazioni che Visual Studio 2026 ha già integrate.
Integrazione con Office 365
Microsoft ha annunciato che integrerà nuove funzionalità di Copilot per Microsoft 365 alimentate dai modelli di Anthropic (tra cui la modalità agente) e lo vedremo in azione prima su Excel/Word ed in una seconda fase su Powerpoint. Microsoft ha scommesso fin da subito su OpenAI, ma questi annunci fanno presagire che casa Cupertino stia ampliando la sua visione anche a modelli differenti, visto anche i recenti battibecchi con Sam Altman inerenti alla direzione che vorrebbero dare ad OpenAI.
Claude Code – Checkpoint
Immaginate di aver sviluppato un’applicazione che usa Claude per generare report medici. Abbiamo testato tutto con Claude Sonnet 4.5 del 30 settembre 2025 e funziona perfettamente: il formato è corretto, il tono è appropriato i feedback dagli utenti sono positivi.
Grazie ai checkpoint sarà possibile continuare ad utilizzare quello specifico modello, senza subire gli “aggiornamenti” del modello rilasciati da Anthropic che potrebbero variare lo stile delle risposte.
Sicurezza migliorata
I miglioramenti della nuova versione si estendono anche sulla sicurezza del modello, intesa sia dal punto di vista dei contenuti delle risposte che dal punto di vista più “tecnico”. Partendo da questo secondo punto è stato migliorato il controllo e la gestione del prompt injection e che permetteva di forzare alcuni comportamenti.
Per quanto riguarda il primo punto invece è stata migliorata la gestione di chat i cui contenuti tendono ad essere quelli di servilismo da parte del modello, inganno e forzatura ma anche nella ricerca di risposte pericolose.
Oltre a tutto questo Claude implementa un livello di sicurezza AI 3 (ASL-3), un livello “intermedio” nella sua scala di sicurezza. Questo livello di sicurezza prevede specifiche fasi sia prima che dopo il rilascio di un modello (es. Valutazioni durante il training, limitazione contenuti pericolosi, monitoraggio utilizzo improprio, ecc)
Estensione di Chrome (Solo utenti Max)
Gli utenti con il piano Max hanno accesso in anteprima ad un plugin che permette di utilizzare Claude all’interno di Chrome, sia per sintetizzare i contenuti delle pagine sia per interagire con essa. Mi aspetto che questa funzionalità sarà rilasciata con la prossima versione del modello. Vi lascio il link al loro articolo per approfondire: https://www.anthropic.com/news/claude-for-chrome
Immagina con Claude (Solo utenti Max)
Anche questa funzionalità è esclusiva per gli abbonati del piano Max e permette di generare un sito web in funzione del prompt scritto. Il sito web generato sarà solamente visuale, ideale per esplorare idee sul layout o sulle funzionalità di una pagina prima di concentrarsi sullo sviluppo del prodotto. Tutto questo è reso possibile grazie ad agenti che si occupano di creare il sito web per noi per poi renderizzarlo a schermo
Benchmark
Quanto abbiamo descritto fino adesso ci ha dato un quadro generale delle novità introdotte.. Ma come se la cava nell’arena delle AI? Come si posiziona rispetto ai suoi rivali? Non includerò nessun grafico in questo articolo, in quanto ogni modello eccelle in alcuni aspetti mentre in altri non è sempre il migliore, riportare qualche grafico darebbe una visione non completa e parziale delle capacità di un modello.
Se volete approfondire ci sono siti specializzati, come ad esempio https://artificialanalysis.ai/
Prezzo
La buona notizia è che il prezzo è rimasto invariato rispetto al precedente modello (4.1) ed il modello è già disponibile per tutti gli abbonati.
Conclusioni ed impressioni
Come già detto all’inizio di questo articolo utilizzo Claude come modello principale da circa due anni e dal punto di vista dello sviluppo (task principale) penso che sia un ottimo strumento di supporto. Recentemente sto testando sia Gemini 2.5 Pro che Perplexity (anche se in questo caso il focus è più incentrato sulla ricerca basata sulle fonti). La mia impressione è che Gemini sia molto più performante quando si tratta di fare analisi: quando devo fare brainstorming o approfondire alcuni aspetti tecnici e complessi di un software o di un’architettura Gemini è quello che mi da più soddisfazione. Claude invece, per quanto anche le sue risposte siano di buon livello, ha un focus molto concentrato sullo sviluppo e le sue risposte includono sempre del codice, anche quando la mia domanda è più di natura architetturale.
Quello che mi incuriosisce molto e che proverò sicuramente nei prossimi giorni è la sua migliorata capacità di mantenere una memoria ed un contesto più focalizzati sull’obiettivo, senza degradare la qualità della conversazione mano a mano che essa procede.