Sztuczna inteligencjaRynekPolecane tematy

Claude Opus 4.7 – autonomia, nowe narzędzia i rosnący rachunek

Felieton

Claude Opus 4.7 wygląda mniej jak rutynowa aktualizacja modelu, a bardziej jak kolejny krok w stronę większej autonomii operacyjnej. Ma lepiej radzić sobie z trudnymi, długimi i wieloetapowymi problemami, ale – co ważniejsze – został zaprojektowany tak, by myśleć bardziej celowo. W założeniu dosłowniej trzyma się instrukcji i w mniejszym stopniu polega na starych nawykach promptowania znanych z wersji 4.6. Z komunikacji Anthropic wynika, że tę zmianę warto traktować nie jako zwykłą podmianę modelu, lecz jako korektę architektury całego workflow agenta.

Claude Opus 4.7 – autonomia, nowe narzędzia i rosnący rachunek

Optymalizacja pod głębsze rozumowanie to ruch, który rynek niezmiennie przyjmuje z zainteresowaniem. Wersja 4.7 idzie właśnie w tę stronę: bardziej dosłowne trzymanie się instrukcji, mniej „domyślania się”, rzadsze niepotrzebne wywołania narzędzi, mniej subagentów tam, gdzie wystarcza dłuższa refleksja. Nowy parametr effort – z poziomem xhigh rekomendowanym dla zadań agentowych – pozwala świadomie sterować głębią namysłu.

Równolegle Anthropic wyraźnie obniża próg wejścia. Rozwija Managed Agents jako zarządzaną pętlę agentową z gotowym zestawem narzędzi, pamięcią i kontekstem. Wprowadza Claude Design – nowy produkt z Anthropic Labs, napędzany właśnie przez Opus 4.7 – który pozwala współpracować z Claudem przy tworzeniu wizualnych artefaktów: prototypów, wireframe’ów, pitch decków czy materiałów marketingowych, z integracją systemu marki i eksportem m.in. do Canvy, PDF czy kodu przez Claude Code. Rośnie też biblioteka skills, dzięki której model automatycznie sięga po predefiniowane zestawy instrukcji i narzędzi. Każde z tych rozwiązań osobno ma charakter inkrementalny. Razem pokazują jednak, że Anthropic nie zostawia klientów samych z poleceniem „zbuduj sobie agenta”, lecz realnie skraca drogę od pomysłu do działającego procesu.

Jednocześnie wzrost kosztów staje się coraz bardziej zauważalny. Opus 4.7 korzysta z nowego tokenizera, który zużywa od 1x do 1,35x więcej tokenów na tym samym tekście. Cena 5/25 dolarów za milion tokenów pozostaje bez zmian, ale realny rachunek za migrację 1:1 może wzrosnąć o kilkanaście do nawet trzydziestu kilku procent – i to bez żadnych modyfikacji promptów. Dochodzi do tego sam kierunek rozwoju modelu: większa skłonność do angażowania poważniejszych zasobów w bardziej złożone zadania.

Odpowiedzią Anthropic jest otwarta promocja strategii advisor. Najmocniejszy model nie musi być domyślnym silnikiem każdego kroku. Wykonawcą może być Sonnet lub Haiku – szybszy i tańszy – a Opus wchodzi tylko tam, gdzie realnie daje największą przewagę. Liczby są wymowne: Haiku z Opus jako doradcą osiąga 41,2 proc. na BrowseComp wobec 19,7 proc. solo, kosztując przy tym o 85 proc. mniej za zadanie niż sam Sonnet.

Zmiana tokenizera oraz sam kierunek rozwoju Opus 4.7 potwierdzają, że wzrost możliwości będzie coraz częściej wymagał równie dojrzałego podejścia do zarządzania kontekstem, kosztem i efektywnością. Przyszłość nie będzie polegać na używaniu coraz większych modeli w każdym miejscu, lecz na coraz mądrzejszej koordynacji autonomii, kosztów i niezawodności. Premiera 4.7 dostarcza narzędzi, które tę koordynację realnie ułatwiają – effort, task_budget, advisor tool, Managed Agents czy Claude Design. Nie zwalnia jednak organizacji z pracy, której nikt za nią nie wykona: zaprojektowania, kiedy eskalować, kiedy nie, za ile i z jaką kontrolą jakości.

Tomasz Lis, AI Advocate w internetowym biurze podróży eSky.pl.

Tagi

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *