Technologia

Claude Fable 5 wraca do sieci po 18 dniach: Anthropic naprawił lukę, nie ograniczył modelu

Adrian Kessler

Claude Fable 5, najpotężniejszy publicznie dostępny model AI Anthropic, jest ponownie dostępny na całym świecie. Powrót następuje po osiemnastu dniach całkowitego zawieszenia, które rozpoczęło się gdy rząd Stanów Zjednoczonych wprowadził kontrole eksportu zobowiązujące Anthropic do weryfikacji narodowości użytkowników w czasie rzeczywistym. Nie mogąc spełnić tego wymogu w globalnej skali Claude, firma zdecydowała się na pełne zawieszenie zamiast częściowego wypełnienia obowiązków.

Techniką, która wyzwoliła kontrole, była metoda jailbreak odkryta przez badaczy Amazon. Metoda wykorzystywała Fable 5 do mapowania podatności oprogramowania w sposoby, które amerykańskie przepisy eksportowe zabraniają określonym obcokrajowcom. Wewnętrzne dochodzenie ujawniło coś, co komplikuje logikę regulacyjną: te same kategorie podatności mogły być identyfikowane za pomocą znacznie mniej zaawansowanych modeli — w tym Opus 4.8, GPT-5.5 i Kimi K2.7. Zdolność ta nie była więc wyłączna dla Fable 5.

Poprawka, która odblokowała kontrole

To, co się zmieniło, to nowy klasyfikator bezpieczeństwa wytrenowany specjalnie do blokowania techniki udokumentowanej przez Amazon. Anthropic podaje, że klasyfikator wykrywa ujawnioną metodę w ponad 99 procentach przypadków. Nie jest to gwarancja ochrony przed przyszłymi jailbreaks — to celowa poprawka znanych podatności. Klasyfikator działa na poziomie wejścia, przekierowując żądania zgodne z udokumentowanymi wzorcami zanim model je przetworzy.

Szersze implikacje są ważne dla przyszłego kształtu regulacji AI. Kontrole eksportu zastosowano wobec Fable 5 nie dlatego, że model był jedynym zdolnym do spowodowania szkody, lecz dlatego że znana technika go wykorzystywała. Zostały zniesione nie dlatego, że ramy regulacyjne rozwiązały ten problem, ale dlatego że klasyfikator zamknął udokumentowaną lukę. Anthropic współpracuje z Amazon, Microsoft i Google nad wspólnymi ramami oceny ciężkości jailbreaks AI według czterech kryteriów: pozyskiwania zdolności, zasięgu tego pozyskiwania, łatwości weaponizacji i wykrywalności. Te ramy nie istnieją jeszcze jako publiczny standard.

Co robi model i ile kosztuje

Sam model nie zmienił się. Fable 5 jest zaprojektowany do wymagającego rozumowania dalekiego zasięgu i pracy agentycznej — zadań wymagających planowania, wykonania i korekty kursu w długich sekwencjach bez ludzkiej akceptacji na każdym kroku. Okno kontekstowe wynosi milion tokenów, co jest też wartością domyślną. Maksymalne wyjście na odpowiedź to 128 000 tokenów. Myślenie jest zawsze aktywne i zwracane jako czytelne podsumowanie zamiast surowego łańcucha myśli.

Dostęp wiąże się z warunkami, które nie istniały przed zawieszeniem. Fable 5 wymaga teraz 30-dniowego przechowywania danych — nie jest dostępny w ramach umów zerowej retencji. Ma to bezpośrednie znaczenie dla organizacji z sektora ochrony zdrowia, prawnego i rządowego, gdzie umowy zero-retencji są często podstawowym wymogiem przy wdrażaniu narzędzi AI. Cennik przekracza poziom Opus: dziesięć dolarów za milion tokenów wejściowych, pięćdziesiąt za milion wyjściowych. Żądania aktywujące klasyfikatory bezpieczeństwa mogą być obsługiwane przez model zastępczy zamiast być odrzucane, a widoczność tej zamiany dla użytkownika końcowego zależy od konfiguracji operatora.

Dostępność

Fable 5 ma model sibling — Claude Mythos 5 — z tymi samymi podstawowymi możliwościami i tymi samymi cenami, ale z ofensywnymi funkcjami cyberbezpieczeństwa, których Fable 5 nie posiada. Mythos 5 jest dostępny przez Project Glasswing. Dostęp do Mythos 5 przywrócono dla niektórych organizacji amerykańskich tydzień przed globalnym powrotem Fable 5.

Fable 5 jest dostępny teraz na platformie Claude, Claude.ai, Claude Code i Claude Cowork. Dla planów Pro, Max, Team i wybranych Enterprise model jest wliczony do 50 procent tygodniowych limitów użycia do 7 lipca, po czym przechodzi na rozliczenie kredytami użycia. Dostęp przez AWS, Google Cloud i Microsoft Foundry jest przywracany stopniowo. Ramy regulujące postępowanie przy kolejnej nowej technice obejścia są jeszcze w budowie.

Tagi: , , , , ,

Dyskusja

Jest 0 komentarzy.