Anthropic predstavio Sonnet 4.5 — najnapredniji AI model za kodiranje do sada
Manje od šest meseci nakon što je lansirao Opus 4 i Sonnet 4, Anthropic je predstavio novu verziju — Sonnet 4.5, koji kompanija opisuje kao najbolji AI model za programiranje do sada. Model se ističe po benchmark rezultatima u kojima nadmašuje prethodne verzije, skuplji Opus 4.1, kao i konkurentske sisteme poput Google Gemini 2.5 Pro i OpenAI GPT-5.
Performanse i sposobnosti
Na testnom paketu OSWorld, koji procenjuje sposobnost AI sistema u rešavanju realnih računarskih zadataka, Sonnet 4.5 postigao je rekordnih 61,4%, što je čak 17 poena više od Opus 4.1. Pored toga, model sada može autonomno da radi na višekoračnim projektima duže od 30 sati, dok je Opus 4 na lansiranju izdržavao oko sedam sati. Ovaj napredak smatra se ključnim korakom u razvoju agentnih sistema kojima Anthropic teži.
Fokus na bezbednosti
Anthropic tvrdi da je Sonnet 4.5 njegov najsigurniji AI model do sada. Prošao je obimnu obuku sa ciljem smanjenja rizika od „poništavanja“, obmanjivanja, preterane ambicije ili podsticanja nerealnog razmišljanja — osobina koje su poslednjih meseci problematične za konkurente poput OpenAI-ja. Takođe, model ima pojačane zaštite od prompt injection napada i lansiran je u okviru okvira AI Safety Level 3, što podrazumeva filtre protiv opasnih upita povezanih sa hemijskim, biološkim i nuklearnim oružjem.
Claude poboljšanja i nove opcije
Uz novo izdanje, Anthropic je unapredio i ceo Claude ekosistem:
- Claude Code dobio je osvežen terminal interfejs i opciju checkpoints, koja omogućava čuvanje i vraćanje na prethodno stanje koda.
- Funkcija file creation, predstavljena početkom meseca, sada je dostupna svim Pro korisnicima.
- Korisnici koji su bili na listi čekanja za Claude ekstenziju za Chrome sada mogu da je koriste.
Cena i tržišni kontekst
API cena za Sonnet 4.5 ostaje nepromenjena: 3 dolara za milion ulaznih tokena i 15 dolara za milion izlaznih tokena. Lansiranje dolazi u trenutku kada Anthropic beleži značajan uspeh — samo dan nakon što je Microsoft dodao Claude modele u Copilot 365, OpenAI je priznao da njegov rival trenutno nudi najbolje AI rešenje za poslovne zadatke.
Izvor: Engadget



